Xilinx 公 司 大 学 计划 推荐 教材 


@ 面向 “工程 教育 认证 ”计算 机 系列 课程 规划 教材 
Xilinx 一 教育 部 产 学 合作 教学 改革 项 目 


Computer Composition Principle Online Experiment Course 
Teaching and Practice of FPGA Remote Experiment Platform 


计算 机 组 成 原理 在 线 实验 教程 


FPGA 远 程 实 验 平台 教学 与 实践 


@ KEE FMA RTA HX ”编著 


Chai Zhilei Li Peiqi Wu Zigang Yang Wenmin 


- “ 线 上 线 下 结合 、 课 内 课外 一 体 化 ”的 实验 环境 
a 基于 RISC-V 及 开源 项 目 进行 实验 
n 采用 Python 程序 与 所 设计 的 硬件 模块 进行 交互 


TELERI 


面向 “工程 教育 认证 ”计算 机 系列 课程 规划 教材 


计算 机 组 成 原理 在 线 实验 教程 
一 一 FPGA 远程 实验 平台 教学 与 实践 


RAE Fm AIN m% AG 


清华 大 学 出 版 社 
北京 


内 容 简 介 


本 书 以 线 上 线 下 结合 的 方式 ,使 用 FPGA 平台 完成 数字 电路 及 计算 机 组 成 原理 实验 ,并 用 Python 编 
程 的 方式 与 自己 设计 的 硬件 系统 交互 ,来 进行 系统 验证 与 调试 。 全 书包 含 三 大 部 分 内 容 : 首先 是 实验 所 用 
的 软 硬 件 工具 和 平台 ; 其 次 是 实验 设计 方法 ; 最 后 介绍 实验 内 容 安排 的 建议 。 书 中 主要 讲述 了 PYNQ 平 
台 与 基于 Python 的 软 硬 件 交 互 、Vivado 开发 工具 .硬件 描述 语言 简介 、RISC-V 开源 项 目 及 组 成 原理 实验 
内 容 建议 等 。 

本 书 可 用 作 高 等 院 校 计算 机 类 、 电 子 信 息 类 专业 的 数字 电路 与 组 成 原理 相关 课程 的 实验 教材 ,也 可 作 
H FPGA 及 嵌入 式 系统 软 硬 件 学 习 的 参考 用 书 。 


本 书 封 面 贴 有 清华 大 学 出 版 社 防伪 标签 ,无 标签 者 不 得 销售 。 
版 权 所 有 ,侵权 必 究 。 侵 权 举报 电话 : 010-62782989 13701121933 


图 书 在 版 编目 (CIP) 数 据 


计算 机 组 成 原理 在 线 实验 教程 : FPGA 远程 实验 平台 教学 与 实践 / 柴 志 雷 等 编著 . 一 北京 : 
清华 大 学 出 版 社 ,2020. 1 

面向 “工程 教育 认证 ”计算 机 系列 课程 规划 教材 

ISBN 978-7-302-53779-3 


I. Oie H. @ 柴 … M. 计算 机 组 成 原理 一 实验 一 高 等 学 校 一 教材 N. DTP301-33 
中 国 版 本 图 书馆 CIP 数据 核 字 (2019) 第 200064 号 


责任 编辑 : 刘 星 
封面 设计 : ou 
责任 校对 : 梁 K 
责任 印 制 : 李 红 英 


出 版 发 行 : 清华 大 学 出 版 社 
网 HE: http://www. tup. com. cn. http://www. wqbook. com 
地 址 : 北京 清华 大 学 学 研 大 厦 A RE 邮 
社 总 机 : 010-62770175 邮 
投稿 与 读者 服务 : 010-62776969, c-service@ tup. tsinghua. edu. cn 
质量 反馈 : 010-62772015. zhiliang@tup. tsinghua. edu. cn 
课件 下 载 : http://www. tup. com. cn.010-83470236 


编 : 100084 
购 : 010-62786544 


印 装 者 : 清华 大 学 印刷 厂 

经 销 : 全 国 新 华 书店 

开 “本: 185mmX260mm M 张 : 11 字 ” 数 : 265 千 字 

版 次 : 2020 年 1 月 第 1 版 印 X: 2020 年 1 月 第 1 次 印刷 
定 价 : 39.00 元 


产品 编号 : 068985-01 


随 着 人 类 社会 迈 向 万 物 互联 的 物 联网 时 代 , 借 由 人 工 智 能 技术 替代 手工 方式 对 大 数据 
进行 高 效 实 时 的 处 理 已 成 为 社会 发 展 的 必然 选择 ,万物 互联 的 未 来 之 路 一 定 走向 万 物 智 能 ， 
而 人 工 智 能 的 构成 要 素 包 含 数据 .算法 及 计算 力 。 在 此 背景 下 ,无 处 不 在 的 人 工 智能 对 计算 
系统 的 计算 能 力 提 出 了 挑战 性 的 需求 ,目前 如 火 如 茶 的 边缘 计算 即 是 对 这 一 挑战 的 积极 应 
对 。 而 使 得 计算 力 需求 更 加 充满 挑战 的 原因 是 : 长 期 以 来 半导体 行业 遵循 的 摩尔 定律 和 登 
纳 德 缩放 定律 已 难以 为 继 , 这 意味 着 芯片 计算 能 力 的 提升 已 经 无 法 在 保持 架构 基本 不 变 的 
情况 下 仅 靠 工艺 的 提升 来 完成 ,也 意味 着 未 来 我 们 将 更 多 地 需要 依赖 架构 创新 ,为 应 用 定制 
芯片 .根据 应 用 需求 深度 优化 软 硬 件 系 统 。 因 此 高 校 培养 的 人 才 也 要 比 过 去 更 多 地 掌握 硬 
件 设 计 及 软 硬 件 协同 优化 的 知识 ,这 也 是 近年 来 教育 部 高 等 学 校 计算 机 类 教学 指导 委员 会 
一 直 在 大 力 推进 “计算 机 系统 能 力 ” 培 养 的 原因 。 

经 过 若干 年 的 努力 ,与 系统 能 力 紧 密 相关 的 课程 ,尤其 是 以 “计算 机 组 成 原理 ”为 代表 的 
课程 的 教学 及 实践 已 经 有 了 长 足 的 进步 。 越 来 越 多 的 学 校 开始 采用 FPGA 作为 实验 教学 
的 平台 ,并 尝试 将 “数字 逻辑 ”计算 机 组 成 交 体 系 结构 ”编译 原理 ”甚至 "操作 系统 ”等 多 门 
课程 的 实践 环节 贯通 ,以 此 培养 学 生 的 软 硬 件 系统 能 力 。 以 清华 大 学 ,北京 航空 航天 大 学 、 
浙江 大 学 、 华 中 科技 大 学 、 东 南大 学 、 同 济 大 学 等 为 代表 的 一 些 高 校 在 此 方面 做 了 大 量 的 工 
作 并 已 取得 了 丰硕 的 成 果 。 


总 体 上 看 ,目前 围绕 计算 机 组 成 原理 进行 的 软 硬 件 系统 能 力 培养 具有 如 下 特点 ， 

CD 从 实验 平台 来 看 ,已 采用 FPGA 的 学 校 主体 上 仍 是 以 线 下 的 FPGA 实验 设备 为 载 
体 进行 实验 ,从 时 间 和 空间 上 限制 了 学 生 像 软件 类 的 实验 一 样 随时 随地 进行 。 学 生 实 验 的 
达成 度 严 重 受 限 于 实验 课时 。 

(2) 从 实验 的 调试 和 交互 方式 来 看 ,目前 的 实验 主要 使 用 FPGA 实验 装置 上 的 拨 码 开 
关 、LED、 串 口 等 物理 1/O 进行 ,由 于 数量 有 限 , 极 大 地 影响 了 调试 的 便利 性 。 

(3) 从 实验 内 容 来 看 ,鉴于 《计算 机 组 成 与 设计 : 软 硬 件 接口 }》 一 书 的 巨大 影响 力 ,多 数 
学 校 选择 的 实验 内 容 是 兼容 MIPS 指令 集 的 处 理 器 设计 。 虽 然 MIPS 指令 集 非常 经 典 ,用 
于 教学 时 理论 及 实践 素材 都 十 分 丰富 .但 难 掩 其 产业 界 影响 偏 小 、 产 学 融合 深度 和 广度 有 限 
的 缺憾 。 因 此 常见 的 组 合 是 ,在 讲授 组 成 与 体系 结构 时 采用 MIPS 架构 ,但 在 讲授 后 续 嵌 人 
式 系统 时 却 几乎 都 切换 成 了 ARM 体系 。 

因此 ,为 了 结合 人 工 智能 时 代 计 算 系 统 的 发 展 趋势 进一步 提升 学 生 的 系统 能 力 ,在 前 期 
教 指 委 推动 的 系统 能 力 培 养 工作 基础 上 ,计算 机 组 成 原理 的 实验 教学 还 可 以 在 如 下 方面 进 
一 步 提 升 : 
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CD 实验 平台 方面 : 探索 “ 线 上 线 下 结合 、 课 内 课外 一 体 化 ”的 实验 环境 。 课 内 采用 线 
下 方式 ,让 学 生 对 真实 硬件 有 更 直观 的 认识 。 课 外 采用 在 线 实验 ,使 学 生 可 以 随时 随地 通过 
远程 访问 实验 设备 进行 实验 。 线 上 线 下 的 使 用 方式 保持 一 致 ,从 而 为 学 生 提 供 可 与 软件 实 
验 相 媲美 的 实验 条 件 。 尽 管 目前 越 来 越 多 的 高 校 认 识 到 相 比 传统 的 插 线 式 实验 平台 ,采用 
FPGA 进行 组 成 原理 实验 教学 将 是 未 来 的 发 展 趋势 。 但 现状 是 为 数 不 少 的 学 校 仍然 采用 的 
是 传统 的 插 线 式 平台 ,在 切换 到 FPGA 方式 时 缺少 便捷 的 “ 试 水 ”途径 。 因 此 , 线 上 方式 及 
相应 的 参考 内 容 可 为 系统 能 力 培养 较为 薄弱 的 地 区 提供 一 种 易于 推进 的 模式 。 

(2) 实验 的 调试 和 交互 方式 : 本 书 采用 Python 程序 与 所 设计 的 硬件 模块 进行 交互 。 
鉴于 Python 语言 已 成 为 人 工 智能 时 代 最 为 流行 的 编程 语言 ,使 用 Python 可 以 突破 实验 平 
台 物 理 IO 的 局 限 ,在 提升 交互 便利 性 的 同时 可 锻炼 学 生 的 软 硬 件 协 同 设计 能 力 , 为 学 生 
今后 从 事 人 工 智能 计算 相关 的 工作 葛 定 良好 的 系统 基础 。 对 于 线 上 方式 ,更 没有 必要 刻板 
地 模仿 线 下 设备 的 物理 L/O 交互 却 又 难以 达到 线 下 使 用 的 真实 感 。 

(3) 实验 内 容 和 设计 方法 : 本 书 介绍 基于 RISC-V 的 开源 开放 生态 的 处 理 器 设计 。 鉴 
于 开放 指令 集 RISC-V 在 学 术 、 工 业界 关注 度 的 急剧 增长 及 众多 RISC-V 指令 集 的 开源 处 
理 器 项 目的 快速 发 展 , 从 目前 看 其 最 有 和 希望 构建 起 允许 学 生 探 究 底层 实现 细节 并 促进 产 学 
深度 融合 的 生态 系统 ,而 这 是 目前 其 他 指令 集 系 统 不 具备 的 优势 。 在 硬件 开源 开放 的 背景 
下 ,虽然 逐条 增加 指令 的 增 量 式 处 理 器 设计 方法 依然 重要 ,但 如 何 基于 开源 资源 快速 完成 自 
己 的 系统 也 应 该 开始 引起 更 多 的 重视 。 因 此 ,本 书 建 议 的 实验 内 容 由 浅 入 深 ,最 终 介 绍 如 何 
基于 RISC-V 及 开源 项 目 进行 实验 ,以 使 学 生 的 所 学 在 未 来 可 以 更 好 地 和 企业 界 进行 对 接 。 
当然 ,本 书 提供 的 实验 范例 也 仅 供 参考 ,各 学 校 目前 所 采用 的 内 容 也 都 可 以 方便 地 在 本 书 所 
介绍 的 平台 上 进行 。 


本 书 介绍 如 何以 线 上 及 线 下 方式 使 用 PYNQ 平台 进行 实验 。PYNQ 可 以 支持 
Python, 它 的 核心 芯片 为 Xilinx 的 SoC 方 式 的 Zynq FPGA。 基 于 该 实验 平台 ,不 仅 可 以 满 
足 本 书 中 汉 。… 诺 依 曼 架 构 的 经 典 处 理 器 的 实验 教学 需求 ,而 且 为 学 生 进一步 学 习 非 妈 … 诺 
依 曼 架构 的 硬件 加 速 器 黄 定 好 实验 平台 的 基础 。 在 当前 人 工 智 能 发 展 对 计算 能 力 不 断 提出 
更 高 需求 的 大 背景 下 ,针对 特定 问题 设计 专用 加 速 器 成 为 趋势 ,而 这 些 专用 加 速 器 通常 都 是 
非 冯 “， 诺 依 曼 架 构 的 。 因 此 :学生 在 学 习 计 算 机 组 成 原理 课程 ,掌握 经 典 的 汉 ， 诺 依 曼 架构 
之 后 ,进一步 学 习 突破 冯 “， 诺 依 曼 架 构 限 制 的 专用 加 速 器 的 知识 是 培养 学 生 系统 能 力 的 未 
来 趋势 。 

本 书包 含 三 大 部 分 内 容 : 首先 是 实验 所 用 的 平台 及 开发 工具 ; 其 次 是 设计 方法 ; 最 后 
介绍 实验 内 容 安排 的 建议 。 具 体 如 下 : 

第 1 章 PYNQ 开发 平台 介绍 。 本 章 介绍 本 书 实验 所 用 的 PYN 平台 , 除 介绍 
PYNQ 开发 板 及 开发 板 所 用 的 主 芯 片 Zynq-7020 FPGA 芯片 之 外 ,还 介绍 了 该 款 开发 板 所 
支持 的 PYNQ 框架 及 其 理念 。 

第 2 章 实验 环境 的 准备 。 本 章 介 绍 在 采用 PYNQ 进行 组 成 原理 实验 时 , 线 下 和 线 上 
的 实验 环境 分 别 如 何 准备 ,如 何 通 过 线 上 或 线 下 的 方式 使 用 PYNQ 平台 。 

第 3 章 基于 PYNGQ 的 组 成 原理 实验 流程 概览 。 本 章 主要 介绍 本 书 线 上 及 线 下 所 用 
的 FPGA 实验 平台 一 一 PYNQ 上 组 成 原理 实验 的 概要 流程 ,为 读者 建立 一 个 整体 的 概念 ， 
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方便 理解 后 续 的 章节 内 容 。 

第 4 章 Vivado 开发 流程 。 本 章 介绍 在 PYNQ 平台 上 进行 组 成 原理 实验 时 ,处 理 器 
及 硬件 模块 设计 所 用 的 工具 一 一 Vivado, 详 细 介 绍 使 用 Vivado 进行 开发 时 的 流程 及 一 些 关 
键 开 发 知识 。 

第 5 章 基于 Python 的 IVO 交互 。 本 章 主 要 介绍 如 何 基 于 Jupyter Notebooks, 通 过 
编写 Python 代码 和 用 户 设 计 的 硬件 系统 进行 交互 ,完成 组 成 原理 实验 的 验证 和 调试 。 

第 6 章 硬件 描述 语言 简介 。 本 章 主 要 介绍 Verilog/VHDL 语言 的 基本 设计 方法 和 
基本 模块 示例 ,更 详细 的 介绍 请 参考 相关 书籍 。 

第 7 章 基于 开源 CPU 的 组 成 原理 实验 。 本 章 介 绍 基于 开源 指令 集 RISC-V 及 开源 
的 RISC-V 处 理 器 项 目 进行 组 成 原理 实验 的 理念 及 设计 方法 。 同 时 为 了 扩展 读者 的 知识 
面 ,也 简单 介绍 了 常规 的 逐条 增加 指令 的 增 量 式 设计 方法 。 

第 8 章 实验 内 容 设 计 。 本 章 给 出 一 些 供 参 考 的 组 成 原理 实验 内 容 的 设计 ,高 校 在 开 
展 组 成 原理 实验 教学 时 可 以 直接 选用 本 章 的 实验 ,也 可 以 根据 各 自学 校 的 实际 情况 进行 内 
容 的 重新 设计 和 规划 。 

本 书 前 言 部 分 及 第 1— 5.7.8 章 由 柴 志和 雷 编写 ; 第 6 章 及 第 4.5.7、8 章 中 的 代码 部 分 
HEME RTAS; 阳 文 敏 提 供 了 在 线 平台 的 支持 和 实验 内 容 的 审核 ; 李 康 等 也 参与 
了 部 分 内 容 的 编写 和 校对 ; 中 北大 学 的 秦 品 乐 教授 和 于 一 老师 参与 了 本 书 的 审阅 并 对 内 容 
安排 及 呈现 方式 提出 了 宝贵 的 修改 建议 。 全 书 由 柴 志 雷 统 稿 及 审阅 。 在 本 书 内 容 设计 及 成 
稿 的 过 程 中 ,江南 大 学 计算 机 科学 与 技术 专业 的 本 科 生 提供 了 宝贵 的 反馈 意见 , 唐 雨 声 、 刘 
RE FEE . 李 慧 琳 等 同学 参与 了 实验 案例 的 设计 。 在 本 书 的 撰写 过 程 中 ,得 到 了 江南 大 
学 物 联网 学 院 及 计算 机 科学 与 技术 系 的 大 力 支持 。 本 书 的 工作 还 得 到 了 教育 部 高 等 学 校 计 
算 机 类 专业 教学 指导 委员 会 “系统 能 力 培养 "课程 建设 试点 院 校 项 目 、Xilinx 一 教育 部 产 学 
合作 教学 改革 项 目的 支持 。 在 成 书 的 过 程 中 还 得 到 了 南京 大 学 囊 春 风 教 授 , 太 原理 工大 学 
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$13 PYNQ 开发 平台 介绍 


CHAPTER 1 


1.1. PYNQ 开发 板 


1.1.1 PYNQ Zl 


PYNQ Z1 是 由 美国 迪 芝 伦 公司 (Digilent) 推 出 的 一 款 支 持 PYNQ 框架 (PYNQ 框架 将 
H 1.3 节 中 介绍 ) 的 FPGA 开发 平台 ,其 开发 板 如 图 1-1 所 示 。 


图 1-1 PYNQ Z1 开发 板 


PYNQ Z1 的 具体 配置 如 下 : 

CD 核心 芯片 : Zynq XC7Z020-1CLG400C。 

(2) 存储 : 

* 带 有 16 位 总 线 @1050Mbps 的 512MB DDR3。 

。 16MB Quad-SPI 闪存 ,具有 出 厂 编程 的 全 球 唯 一 标识 符 ( 兼 容 48 位 EUI48/64™) 
* MicroSD fif 

(3) 供电 : 由 USB 或 任何 7 一 15V 电源 供电 。 

(4) USB 和 以 太 网 : 

。 千 兆 以 太 网 PHY。 
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。 USB-JTAG 编程 电路 。 

* USB-UART ff, 

* USB OTG PHY( 仅 支持 主机 ) 。 

(5) 音频 和 视频 : 

。 具 有 脉冲 密度 调制 (PDM) 输 出 的 驻 极 体 麦克 风 。 
。 3.5mm 单 声 道 音 频 输出 插 孔 。 

。 HDMI 接收 端口 (输入 )。 

* HDMI 源 端口 (输出 )。 

(6) 开关 ,按钮 和 LED: 

。 4 个 按钮 。 

。 2 个 滑动 开关 。 

。 4 个 LED。 

。 2 个 RGB LED。 

(7) 扩展 连接 器 : 

。 两 个 标准 Pmod 端口 。 

* 16 个 FPGA 1/0 接口 (与 树 攻 派 接口 共享 8 个 引 脚 ) 。 
(8) Arduino/chipKIT 屏蔽 连接 器 : 

。49 个 FPGA I/00. 

。 6 个 XADC 的 单 端 0 一 3. 3V 模拟 输入 。 

* 4^7 XADC 的 差分 0 一 1.0V 模拟 输入 。 


1.1.2 PYNQZ2 


PYNQ Z2 是 台湾 厂商 TUL 推出 的 支持 PYNQ 开源 框架 的 第 二 代 开 发 平台 ,其 开发 板 
如 图 1-2 所 示 。 


图 1-2 PYNQ Z2 开发 板 


PYNQ Z2 的 具体 配置 如 下 : 

CD 核心 芯片 : Zynq XC7Z020-1CLG400C 。 

(2) 存储 : 

。 带 有 16 位 总 线 @1050Mbps 的 512MB DDR3。 
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* 16MB Quad-SPI 闪存 ,具有 出 三 编程 的 全 球 唯一 标识 符 ( 兼 容 48 位 EUI-48/64)。 

* MicroSD 插 槽 。 

(3) 供电 : 由 USB 或 7 一 15V 电源 供电 。 

(4) USB 和 以 太 网 : 

。 千 兆 以 太 网 PHY. 

。 USB-JTAG 编程 电路 。 

。 USB-UART 桥 。 

。 USB OTG PHY( 仅 支持 主机 )。 

G) 音频 和 视频 : 

* 具有 24 位 DAC Hx fé PS 协议 的 3.5mm TRRS Hifl. 

* 3. 5mm 线路 输入 插口 。 

* HDMI 接收 端口 (输入 )。 

* HDMI 源 端口 (输出 )。 

(6) 开关 ,按钮 和 LED: 

。 4 个 按钮 。 

。 2 个 滑动 开关 。 

。4 个 LED。 

。2 个 RGB LED。 

(7) 扩展 连接 器 : 

。 两 个 标准 Pmod 端口 。 

。16 个 FPGA I/O %0 C ERE URBE ET E 8 个 引 脚 ) 。 

(8) Arduino 屏蔽 连接 器 : 

。24 个 FPGA I/O, 

。 6 个 XADC 的 单 端 0 一 3. 3V 模拟 输入 。 

* Raspberry Pi 连接 器 。 

* 28 个 FPGA I/O (与 Pmod A 接口 共享 8 个 )。 

* 低 延 时 控制 。 

从 上 面 的 介绍 可 见 ,PYNQ Z1 和 PYNQ Z2 都 采用 了 同一 型 号 的 核心 芯片 ,在 开发 板 
的 配置 上 有 很 多 的 相似 之 处 ,因此 对 于 计算 机 组 成 原理 实验 来 说 具体 使 用 哪 一 款 板 卡 都 是 
可 以 的 。 

它们 的 主要 区 别 在 于 扩展 接头 和 音频 系统 。PYNQ-Z2 使 用 Raspberry Pi 接头 取代 
T PYNQ-ZI 上 的 chipKIT 接头 。PYNQ-Z1 具有 带 PWM 输入 的 集成 MIC 和 单 声 道 
PDM 音频 输出 。PYNQ-Z2 具有 完整 的 ADI 音频 编 解码 器 ,还 带 有 耳机 、 麦 克 风 和 线路 
输出 。 


1.2 Zynq 7020 芯片 


从 1.1 节 中 的 介绍 可 发 现 ,PYNQ Z1 和 PYNQ Z2 开发 板 使 用 的 核心 芯片 都 为 Zynq 
7020 芯片 ,具体 型 号 为 Zynq XC7Z020-1CLG400C。 
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Zynq 7020 Æ Xilinx 公司 推出 的 全 可 编程 SoC 芯片 (AP SoC, All Programmable 
System on Chips) ,与 其 他 Zynq 7000 系列 芯片 具有 相同 的 架构 , 它 主要 由 PSCProcessing 
System, 处 理 器 ) 和 PL (Programmable Logic. 可 编程 逻辑 FPGA) 两 大 部 分 组 成 ,所 以 
PYNQ 可 被 看 作 一 个 具有 可 编程 逻辑 模块 的 计算 机 。 其 内 部 架构 如 图 1-3 所 示 。 

Zynq XC7Z020-1CLG400C 芯片 内 的 模块 如 下 : 

CD. 主 频 650MHz 的 双核 ARM Cortex-A9 处 理 器 。 

(2) DDR3 内 存 控制 器 ,具有 8 个 DMA 通道 和 4 个 高 性 能 AXI 从 端口 。 

G) 高 速 外 设 控制 器 : 1GHz 以 太 网 ,USB 2.0,SDIO 。 

(4) 低速 外 设 控制 器 : SPILUART.CAN.T'C, 

(5) 可 通过 JTAG,Quad-SPI 闪存 和 MicroSD 卡 进行 可 执行 流 文件 的 烧 写 。 

(6) PL 部 分 采用 的 是 Artix-7 系列 的 可 编程 逻辑 ,具体 资源 如 下 : 

* 13 300 个 逻辑 块 , 每 个 逻辑 块 具 有 4 个 6 输入 LUT 和 8 个 触发 器 。 

* 630KB 的 快速 Block RAM, 


ft 
处 理 器 系统 
NOR 与 NAND Flash 控 制 器 多 端口 DRAM 控 制 器 
SRAM 和 Quad SPI DDR3 、DDR3L 以 及 DDR2 
2 个 SPI AMBAH i AMBA 桥 
na f Kl 7 
E] 
器 K 2 个 PC O 
输 多 核 
^f 2 个 CAN KA NEON 的 SIMD 和 FPU | NEON 的 SIMD 和 FPU 
输 
人 出 2TUART KA ARM Cortex-A9 ARM Cortex-A9 

多 
H en ao KA Snoop 控 制 单 元 
择 2 个 具有 DMA 512KB L2 缓 存 256KB 片 上 存储 
器 KE? 荔 能 的 SDIO fe] — 

一 GIC JTAGXGBERMGE| 配置 | 定时 器 | DMA 

ky 2 个 具有 DMA ky 
功能 的 USB ji T 
| 人 县 PMA 能 ka 1 1 
的 千 兆 以 太 网 口 AMBA 桥 
AES, SHA, 
HL EMIOD RSA 安 全 模块 
通用 AXIDI ACPO 高速 AXIDI 
XADC PCIe2.0 
2 个 ADC、 多 路 选择 器 可 编程 迎 辑 8438 
温度 传感器 (逻辑 门 、DSP 及 RAM) 
ji 
多 个 电压 标准 的 输入 输出 (3.3V 以 及 高 速 1.8V) 品行 收发 器 
u 4 


图 1-3 Zynq7000 芯片 架构 示意 图 
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。4 个 时 钟 管理 单元 ,每 个 有 一 个 锁 相 环 (PLL) 和 混合 模式 时 钟 管理 器 (MMCM)。 
。 220 个 DSP。 
。 片上 模 数 转换 器 (XADC) 。 


1.3  PYNQ 框架 


PYNQ 是 一 个 开源 框架 , 旨 在 使 基于 Xilinx Zynq 的 嵌入 式 系统 设计 更 加 容易 。 
PYNQ 开源 框架 主要 包含 PYNQ 硬件 库 (Overlay) 以 及 Overlay 的 设计 和 调用 方法 。 
PYNQ 框架 中 实现 了 用 来 加 载 和 使 用 Overlay 的 Python Æ ,允许 通过 PS 中 运行 的 Python 
来 控制 PL 中 的 Overlay,Overlay 即 在 PL 中 运行 的 一 个 具体 硬件 模块 实现 。 

因为 FPGA 设计 通常 需要 具有 硬件 知识 ,PYNQ 的 Overlay 层 由 硬件 设计 人 员 创 建 ， 
并 提供 相应 的 PYNQ Python API。 而 软件 开发 人 员 就 可 以 使 用 Python 接口 来 调用 和 控制 
所 需 的 硬件 Overlay 构成 满足 需求 的 软 硬 件 协同 计算 系统 。 

Overlay 由 三 部 分 构成 : 

。 配置 PL i FPGA 的 比特 流 文件 (bit-stream)。 

。 包含 IP 核 信息 的 Vivado Block Design TCL 文件 。 

。 读 取 IP 核 属性 的 Python API, 

PYNQ 框架 的 理念 就 是 将 软件 和 硬件 开发 隔离 开 , 硬 件 人 员 仅 关注 特定 Overlay 的 设 
计 而 无 须 关 注 整 个 应 用 ,而 软件 或 应 用 开发 人 员 基 于 Python 可 快速 开发 适合 不 同 需求 的 
应 用 ,并 通过 调用 Overlay 获得 硬件 加 速 来 保证 整个 系统 的 运行 效率 。 随 着 Overlay 的 不 
断 积累 和 丰富 ,PYNQ 生态 就 会 在 应 用 的 开发 效率 和 系统 的 计算 能 效 两 方面 都 获得 更 好 的 
表现 。 目 前 PYNQ 官方 支持 的 开发 板 有 Digilent 的 PYNQ Z1 开发 板 ,TUL 的 PYNQ Z2 
开发 板 及 Xilinx 自 有 的 ZCU104 开发 板 。 此 外 ,PYNQ 还 可 以 支持 安富 利 Ultra96 及 其 他 
的 一 些 第 三 方 Zynq 类 的 板 卡 。PYNQ 官网 http://www. pynq. io/board. html 提供 了 所 支 
持 的 板 卡 的 映像 文件 ,同时 介绍 了 如 何 为 第 三 方 板 卡 制作 映像 文件 。 


1.4 PYNQ 平台 的 使 用 


如 前 所 述 ,PYNQ 平 台 就 是 一 台 由 支持 Python 编程 且 具 有 可 编程 迎 辑 块 的 异 构 计算 
芯片 构成 的 计算 机 。 它 可 以 放 在 现场 使 用 ,当然 也 可 以 部 署 在 云端 通过 远程 访问 进行 使 用 。 
关于 PYNQ 的 实验 环境 的 具体 准备 , 详 见 第 2 章 。 


第 2 章 实验 环境 的 准备 


CHAPTER 2 


实验 环境 的 准备 分 为 线 下 和 线 上 两 种 方式 : 

(1) 线 下 方式 指 的 是 传统 的 在 本 地 机 器 安装 开发 软件 和 连接 实验 板 卡 的 方式 。 

(2) 线 上 方式 指 的 是 开发 软件 和 实验 板 卡 都 部 署 在 云 上 ,用 户 通过 远程 登录 网 站 访问 
软件 和 实验 板 卡 的 方式 。 

我 们 还 可 以 将 这 两 种 方式 组 合 使 用 : 如 本 机 安装 Vivado 软件 ,但 到 云 上 使 用 PYNQ 
板 卡 ; 或 者 Vivado 在 云 上 ,但 使 用 本 地 板 卡 。 


2.1 线 下 方式 实验 环境 的 准备 
2.1.1 在 本 机 安装 Vivado 软件 


访问 https://www. xilinx. com/support/download. html(Xilinx 官网 ) ,下 载 Vivado 
在 线 安 装 文件 (或 者 下 载 完整 安装 包 ) 进 行 安装 。 以 Vivado 2018. 2 为 例 ( 仅 展示 关键 安装 
步骤 ) ,在 Select Edition to Install 界面 选择 Vivado HL Design Edition, Wh E] 2-1 所 示 o 

在 安装 成 功 后 ( 见 图 2-2) ,打开 Vivado License Manager 2018. 2 ,选择 左 侧 的 Load 
License, 然 后 单 击 Copy License 按钮 ,选择 License, KR. 


2.1.2. PYNQ 板 卡 的 准备 


1. PYNQ 板 卡 的 启动 

当 用 户 以 线 下 方式 使 用 PYNQ 时 ,首先 要 做 的 工作 是 准备 一 张 至 少 8GB 的 SD 卡 ,再 
在 PYNQ 官 网 下 载 与 板子 适 配 的 PYNQ 映像 文件 ,并 将 映像 文件 烧 录 到 SD 卡 中 。PYNQ 
开发 板 一 般 使 用 USB 供电 的 方式 , 它 同 时 可 以 作为 串口 使 用 。 使 用 此 种 供电 方式 需要 将 
图 2-3 中 标号 四 处 的 电源 跳 线 帽 设置 到 USB 位 置 ,使 用 USB 连接 PC 或 笔记 本 电脑 (后 面 
统称 本 地 计算 机 ) 和 板 卡 。 在 启动 PYNQ 开发 板 时 ,首先 将 已 经 烧 录 好 PYNQ 映像 文件 的 
SD 卡 插入 开发 板 卡 槽 中 ,然后 通过 图 2-3 中 标号 加 处 的 Boot 跳 线 帽 选择 从 SD 卡 启动 。 打 
开 电 源 开关 , 约 Imin 后 两 个 蓝 色 LED 和 四 个 黄色 /绿色 LED 同时 闪烁 ,随后 蓝 色 LED XT 
熄灭 ,PYNGQ 开发 板 启动 成 功 。 

2. PYNQ 板 卡 的 具体 连接 

CD 将 PYNQ 板 卡 和 本 地 计算 机 直接 相连 。 

。 使 用 网 线 将 PYNQ 板 卡 与 本 地 计算 机 直 连 。 
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E Vivado 2018.2 Installer - Select Edition to 


Select Edition to Install 
tam edition t 
© Vivado HL WebPACK. 


Vivado NL WebPACK is the ne cost, device lieited versien of Vivado NL Design Edition Users can optionally add Model Composer and 
System Generator for DSP te this installatien. 


(& Vivade HL Design Edition 


Vivado XL Design Fdition incl 
High-Level Synthes 


les the full complement of Vivado Design Suite tools for design, including C-based design with Vivado 
Tav 


implementation, verification and device programing Complete device support, cable drivers and Documentation 
or are included. Users can optionally add Model Composer to this installation 


© Vivado HL System Edition 


Vivado HL System Edition is a superset of Vivado HL Design Edition with the addition of System Generator for DSP. Complete device 
support, 


cable drivers and Documentation Navigator are included Users can optionally sdd Model Composer te this installation. 


© Decwentation Navigator (Standalone) 


Xilinx Documentation Navigator Woclav) provides access te lilinr technical documentation both on the Web and on the Desktop. This is a 
standalone installation without Vivado Design Suite. 


Copyright © 1986-2019 ilinx, Inc 


AI rights reserved 


图 2-1 安装 版 本 选择 页 面 


£ XILINX 
VIVADO” ` icense manager 


Cer! 


Click the "Copy License’ butten te copy a certifiente-bas 


license (lie file) into the 
MATPDAIAXMlisalicense directory. Kilimz applications automatically detect valid, mode-locked licenses 
(e die) ren 


irm rne ira ret ing in da APPDATA lira ese 


View License Status. 
4 Vite System Infor 


Qc Re tereti Eee 


2-2 安装 证 书 
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图 2-3 PYNQ 板 卡 的 启动 


* 查看 PYNQ 板 卡 IP 地 址 。 
。 根据 PYNQ 板 卡 IP 地 址 来 设置 本 机 以 太 网 静态 IP, 保 证 本 机 IP 和 板 卡 IP 在 同一 
网 段 。 例 如 , 板 卡 地 址 为 192. 168. 2. 99 ,那么 可 以 设置 本 机 IP 为 192. 168. 2. 1.4 
码 为 255. 255. 255. 0。 
直 联 的 缺点 是 PYNQ 板 卡 与 本 地 计算 机 成 为 孤立 的 系统 ,无 法 访问 到 网 络 。 
(2) 或 者 将 PYNQ 板 卡 连接 到 具有 Internet 访问 权限 的 网 络 或 者 路 由 器 端口 ,并 使 其 
与 本 地 计算 机 处 于 同一 网 段 , 之 后 可 以 查看 PYNQ 板 卡 IP 地 址 。 
(3) 如 何 查 看 PYNQ 板 卡 的 IP 地 址 。 
PYNQ 板 卡 启动 后 ,可 以 通过 串口 终端 软件 Xshell 或 者 开源 免费 的 Putty 查看 板 卡 
IP, D Putty 为 例 : 打开 Putty, 选 择 Serial。 其 中 ,COM 端口 可 以 在 “设备 管理 器 * 下 的 “ 端 
口 ”中 查 到 。 填 写 COM 端口 和 Speed( 如 115200) ,再 单 击 Open 按钮 ,如 图 2-4 所 示 。 使 用 
命令 ifconfig 可 以 查看 板 卡 IP 地 址 ( 方 框 选中 的 内 容 ) ,如 图 2-5 所 示 。 


fi PuTTY Configuration F- 
Category: 
日 Session Basic options for your PuTTY session 
^ Specify the destination you want to connect to 
rer Serial ine Speed 
Bel COME 115200 
Features Connection te: 
E- Window ORaw © Tehet © Regn ©SSH ®© Serial 
iab. Load, save or delete a stored session. 
Translation. sm 
| Selection 
Colours Odak 
E Comnecton nud Cm] 
站 ( seve | 
Tenet Deae ] 
= Rlogin. 
由 SSH 
os Cose window on ext: 
CO Aways CO Neve — G Oriy on dean et 


E= mw] Com ][ cm 


图 2-4 Putty 界面 
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a coM6 - PuTTY 


图 2-5 查看 板 卡 IP 


2.1.3 使 用 Jupyter Notebook 与 PYNQ 建立 连接 
打开 web 浏览 器 (建议 使 用 Chrome 或 360 极速 浏览 器 ) ,访问 板 卡 IP 地 址 就 连接 到 了 


Jupyter Notebook 服务 。 此 时 需要 输入 用 户 名 和 密码 ,请 输入 用 户 名 : xilinx, 密 码 xilinx, 
即 可 打开 如 图 2-6 所 示 的 Jupyter Notebook。 单 击 右 上 角 的 Upload ,选择 想 要 上 传 的 文件 ， 
单 击 “ 打 开 ” 按 钮 ,出 现 如 图 2-7 所 示 的 界面 ,再 单 击 Upload 即 可 上 传 。Upload 是 把 在 本 机 
的 文件 上 传 到 了 PYNQ 板 卡 的 文件 系统 , 供 后 续 在 Jupyter Notebook 中 使 用 。 


— Jupyter 


图 2-6 Jupyter 界面 


图 2.7 上 传 文件 

另外 ,还 可 以 单 击 某 一 个 文件 左 侧 的 方 框 ,选择 Download 将 PYNQ 板 卡 的 文件 下 载 

到 本 地 计算 机 上 。 注 意 ,下 载 的 xxx. ipynb 文件 必须 是 非 运行 状态 的 (表现 为 灰色 图 标 ) ,如 
图 2-8 所 示 。 如 果 要 下 载 的 文件 刚 运行 过 ,那么 可 以 选中 该 文件 选择 Duplicate 将 其 复制 ， 
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复制 的 文件 是 非 运行 状态 ,下 载 复制 文件 即 可 。 


Z Jupyter Logout 
Fies Runing Clusters 

Dupkcaie || Rename || Move || Dowricod | vew [ES E Upon | New -| © 

Bie m vag cp Name Last Mode 

[=] Tum 

Æ Æ model cpuipyb 248m 

1 个 月 前 


B 局 untted Copy ipb 


B B Unttled ipynb 


图 2-8 下 载 文件 


2.2 线 上 方式 实验 环境 的 准备 


OpenHEC 是 一 个 FPGA 云 平 台 系统 ,通过 在 数据 中 心 部 署 Vivado 虚拟 机 及 PYNQ 
开发 板 ,使 用 户 无 须 安装 软件 并 购买 FPGA 板 卡 就 可 以 进行 实验 。 具 体 使 用 方式 如 下 : 

(1) 输入 网 址 并 登录 ,如 果 没 有 注册 ,先进 行 注册 : 

* 公有 云 : www. iopenhec. com, 

。 d zi 如 果 部 署 有 私有 云 , 则 输入 相应 的 网 址 或 IP 地 址 。 

为 了 展示 方便 起 见 , 以 OpenHEC 公有 云 为 例 说 明 。 输 入 网 址 www. iopenhec. com 进 
入 主页 ,根据 指示 可 访问 相应 的 PYNQ 节点 ,里 面 可 以 看 到 “使 用 虚拟 机 ”和 “使 用 FPGA” 
两 个 选项 。 

。 使 用 Vivado 软件 : 单 击 “ 使 用 虚拟 机 ”, 进 入 后 ,在 桌面 上 双击 Vivado 打开 使 用 ,如 

图 2-9 所 示 。 


000007 


EMR Vivado TRER ARE: 

1，oUib 是 系统 预先 准备 的 对 应 实 输 或 者 项 目的 支撑 包 及 相 
XAR ， 虚 折 机 重启 时 自动 更新 成 虹 新 的 文档 莹 商 时 ; 

2、oDisk 是 对 应用 户 个 人 空间 ( 我 的 oDisk ) ,用 来 同步 和 
保存 个 人 数据 ,虚拟 机 重启 后 计 目 时 下 的 教 所 自动 保存; 

3、 启 动 开发 工具 软件 ,双击 国 , 打开 Terminal Emulator 
ARA viado” 启动 Vvado 20152 

"vado his" BahVivado HLS 2015.2 


图 2-9 使 用 Vivado 


* 使 用 PYNGQ 板 卡 : 单 击 “使 用 FPGA”, 可 直接 连接 到 Jupyter Notebook 服务 并 通过 
输入 xilinx 打开 。 如 图 2-10 所 示 , 如 果 没 有 直接 连接 , 则 打开 Chronium Web 
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Browser, 输 入 网 址 pynq: 9090, 打 开 后 再 输入 密码 xilinx, 之 后 的 使 用 方式 和 线 下 


图 2-10 使 用 FPGA 


(2) oDisk 的 使 用 : 在 使 用 线 上 方式 ,或 者 线 上 线 下 结合 的 方式 时 需要 注意 ,OpenHEC 
系统 中 提供 了 一 个 共享 云 盘 (CoDisk)( 见 图 2-11) ,用 来 在 不 同 的 虚拟 机 空间 ,以 及 用 户 的 本 
机 之 间 传 递 文件 。 如 果 都 使 用 线 上 的 方式 ,用 户 在 使 用 Vivado 和 使 用 FPGA 时 ,可 以 共享 
oDisk 里 面 的 文件 。 如 果 线 上 线 下 结合 使 用 , 则 可 以 通过 OpenHEC 提供 的 文件 上 传 、 下 载 
到 oDisk 和 本 机 之 间 进 行文 件 交换 。 


请 上 传 本 地 文件 至 同步 云 盘 oDisk 中 


文件 的 云 中 转 站 


EAE 
cnt 
uc UR i 
INE Rue 


图 2-11 oDisk 共享 云 盘 
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CHAPTER 3 


本 章 主要 介绍 本 书 所 用 的 FPGA 实验 平台 (PYNQ) 以 及 在 此 平台 上 进行 组 成 原理 实 
验 的 大 致 流程 ,目的 是 为 读者 建立 一 个 整体 的 概念 ,方便 读者 对 后 续 章节 内 容 的 理解 。 


3.1 整体 开发 流程 介绍 


如 图 3-1 所 示 , 当 读者 进行 组 成 原理 相关 的 实验 时 ,例如 设计 一 个 运算 器 (ALU), 通 常 
可 以 采用 原理 图 或 硬件 描述 语言 (Verilog/VHDL) 
作为 设计 输入 方式 ,并 使 用 Xilinx 提供 的 数字 系统 
设计 软件 Vivado 进行 具体 的 设计 。 在 使 用 Vivado 


Zynq7020 
FPGA 芯 片 


进行 开发 的 过 程 中 ,还 需要 指定 所 用 的 FPGA 开发 PIMOT AR 

板 或 FPGA E). Jupyter Xilinx 
如 图 3-1 所 示 , PYNQ 开发 板 就 是 本 书 所 用 的 Notebooks Vivado 

FPGA 开发 板 ,其 所 使 用 的 FPGA 芯片 是 Zynq 7000 

系列 的 Zynq 7020 ,具体 型 号 为 xc7z020clg400-1。 原理 图 
在 使 用 Vivado 经 过 设计 输入 完成 硬件 模块 设 Verilog VHD 

计 之 后 ,再 经 过 仿真 .综合 . 引 脚 绑 定 ` 布 局 布线 等 流 图 3-1 基于 PYNQ 的 组 成 原理 

程 之 后 ,就 可 以 生成 FPGA 芯片 (对 于 PYNGQ 来 说 ， 实验 流程 概览 图 


就 是 其 芯片 的 PL 端 ) 上 运行 的 文件 ,通常 称 为 流 文 
件 或 bit 文件 (. bit 或 . bin 文件 ) 或 比特 流 。 虽 然 使 用 Vivado 可 以 直接 将 流 文 件 下 载 到 
FPGA 上 ,但 在 基于 PYNQ 的 开发 中 , 当 流 文件 生成 之 后 并 没有 直接 进行 下 载 ,而 是 采用 
图 3-1 所 示 的 Jupyter Notebook 进行 Python 代码 的 编写 ,并 在 Python 代码 中 完成 流 文件 
的 下 载 。 在 Python 代码 中 还 可 以 完成 和 流 文 件 所 实现 的 硬件 系统 的 交互 。 

如 第 2 章 所 述 ,进行 组 成 原理 实验 时 需要 用 到 Vivado 开发 工具 及 PYNQ FPGA 实验 
板 卡 ,这 些 开发 环境 的 提供 可 以 采用 线 上 的 方式 ( 即 Vivado 和 PYNQ 可 以 部 署 在 云 上 ) 也 
可 以 采用 线 下 的 方式 ( 即 Vivado 和 PYNQ 部 署 在 本 地 机 器 ) ,甚至 线 上 线 下 混合 的 方式 。 
笔者 认为 ,较为 理想 的 方式 应 该 是 线 上 线 下 结合 的 实验 方式 。 课 内 实验 建议 采用 线 下 方式 ， 
让 学 生 对 真实 硬件 有 更 直观 的 感受 ; 课外 则 要 能 更 广泛 地 支持 在 线 实验 ,使 学 生 可 以 随时 
随地 进行 实验 ,从 而 为 学 生 提供 可 与 软件 实验 相 比 的 实验 条 件 。 
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需要 注意 的 是 ,Zynq7020 芯片 是 一 款 SoC 芯片 (具体 已 在 第 1 章 中 详细 介绍 ) , 它 主要 
由 双核 的 ARM 处 理 器 (在 Zynq 中 通常 称 为 PS,Processing System) 和 FPGA( 通 常 称 为 
PL.Programmable Logic) 两 部 分 构成 。 由 Vivado 生成 的 流 文件 运行 在 PL 上 ,而 Jupyter 
Notebook 及 Python 运行 在 PS 上 .PL 和 PS 之 间 通 过 总 线 进 行 连接 ,两 者 共同 构成 了 一 个 
软 硬 件 协作 的 系统 。 


3.2 Vivado 开发 流程 概览 


本 节 仅 介绍 Vivado 开发 流程 的 概要 ,目的 是 从 整体 上 提炼 Vivado 的 功能 和 使 用 方法 ， 
让 读者 建立 全 局 的 认识 ,而 不 至 于 一 开始 就 陷入 工具 使 用 的 细节 ,影响 对 整体 的 理解 。 更 详 
细 的 Vivado 使 用 细节 将 在 第 4 章 中 进行 介绍 。 

1. 设计 输入 

设计 输入 是 指 用 什么 样 的 方式 进行 系统 的 具体 设计 。 通 常用 于 设计 输入 的 方式 有 两 
种 : 原理 图 的 方式 和 硬件 描述 语言 的 方式 。 

采用 原理 图 的 方式 比较 直观 ,易于 理解 硬件 结构 , 且 不 需要 进行 专门 的 学 习 , 比 较 适 用 
于 初学 者 及 复杂 程度 不 是 很 高 的 系统 。 

硬件 描述 语言 方式 , 即 Verilog HDL 或 VHDL, 是 通过 编写 代码 的 方式 设计 硬件 系统 ， 
在 描述 复杂 程度 较 高 的 系统 时 效率 比较 高 。 因 此 在 实际 的 工程 实践 中 ,通常 采用 硬件 描述 
语言 的 方式 。 但 其 不 足 之 处 是 需要 提前 进行 一 定 的 专门 学 习 才 能 掌握 ,具有 一 定 的 使 用 
ru. 

当然 ,两 种 设计 输入 方式 可 以 混合 使 用 。 用 户 采 用 Vivado 进行 系统 设计 时 ,首先 要 创 
建 一 个 工程 ,然后 可 以 为 该 工程 添加 或 创建 设计 输入 文件 , 即 可 开始 进行 具体 的 设计 输 
AT. 

2. 仿真 

仿真 是 指 不 把 设计 的 硬件 系统 直接 下 载 到 芯片 上 真实 运行 ,而 是 通过 Vivado 软件 对 其 
进行 分 析 ( 实 际 上 是 模拟 ) 。 仿 真 具体 又 分 为 前 仿真 和 后 仿真 。 

前 仿真 ,也 称 为 功能 仿真 或 行为 级 仿真 。 是 指 仅 对 逻辑 功能 进行 测试 模拟 ,以 了 解 其实 
现 的 功能 是 否 满足 原 设 计 的 要 求 。 仿 真 过 程 没 有 加 入 时 序 信息 ,不 涉及 具体 器 件 的 硬件 特 
性 ,如 延 时 特性 。 在 组 成 原理 的 实验 过 程 中 应 用 频率 较 高 。 

后 仿真 ,也 称 为 布局 布线 后 仿真 或 时 序 仿真 。 是 指 提取 有 关 的 器 件 延 时 . 连 线 延 时 等 时 
序 参数 ,并 在 此 基础 上 进行 的 仿真 , 它 是 非常 接近 真实 器 件 运行 情况 的 仿真 。 

基于 FPGA 的 系统 设计 中 ,通常 有 2 个 阶段 可 以 进行 后 仿真 : 第 一 个 阶段 是 针对 特定 
的 FPGA 厂家 技术 的 仿真 ,此 仿真 是 在 综合 之 后 、 实 现 之 前 进行 的 仿真 。 另 一 个 阶段 是 门 
级 仿真 ,此 级 仿真 是 针对 实现 后 的 门 级 时 序 进行 仿真 , 门 级 仿真 体现 了 由 于 布局 布线 而 产生 
的 实际 延 时 。 

3. 综合 

综合 的 功能 有 点 类 似 于 编译 .编译 所 做 的 工作 是 从 用 户 输入 的 源 代码 生成 特定 的 机 器 
代码 。 综 合 所 做 的 工作 是 从 用 户 的 输入 生成 特定 的 网 表 文 件 。 综 合 具体 包含 语言 的 编译 、 
结构 的 优化 及 面向 芯片 的 映射 和 转换 。 
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4. 实现 

实现 主要 是 完成 转换 ,映射 布局 ,布线 和 最 终 比 特 流 的 生成 。 意 思 是 将 综合 生成 的 网 
表 一 步 步 地 与 特定 的 FPGA 芯片 关联 起 来 ,转换 成 该 FPGA 芯片 上 特有 的 资源 并 进行 映 
射 。 布 局 指 的 是 根据 网 表 在 FPGA 芯片 上 定位 所 涉及 的 特定 资源 的 位 置 ; 而 布线 指 的 是 这 
些 特定 资源 之 间 如 何 连接 起 来 。 在 布局 ,布线 之 后 还 可 以 进行 进一步 的 仿真 ,然后 就 可 以 生 
成 在 特定 FPGA 芯片 上 运行 的 流 文件 了 。 

在 综合 之 后 、 实 现 之 前 ,还 有 个 重要 的 工作 是 FPGA 芯片 引 脚 的 绑 定 。 引 脚 绑 定 的 主 
要 目的 是 将 用 户 设计 的 硬件 系统 的 逻辑 L/O 5 FPGA 的 物理 L/O 根据 需要 连接 起 来 ,从 而 
可 以 通过 FPGA 开发 板 上 的 1/0 部 件 ( 如 拨 码 开关 、LED AT 七 段 码 等 ) 与 用 户 设 计 的 硬件 
系统 进行 交互 ,使 得 用 户 设 计 的 硬件 系统 成 为 一 个 具备 I/O 的 完整 的 系统 。 

需要 注意 的 是 : 在 基于 PYNQ 的 组 成 原理 实验 中 ,由 于 Zynq 7020 芯片 是 SoC 芯片 ， 
Python 代码 可 以 运行 在 PS 端 并 和 PL 端的 用 户 模块 进行 交互 。 因 此 ,在 该 平台 上 的 引 脚 
绑 定 阶段 ,可 以 通过 将 用 户 设计 的 硬件 系统 的 L/O 与 PS 端 相连 接 , 从 而 可 以 与 PS 端 运 行 
的 Python 进行 交互 。 


3.3 基于 Python 的 硬件 交互 


众所周知 ,目前 在 基于 FPGA 进行 的 数字 逻辑 .组 成 原理 等 硬件 类 课程 的 实验 教学 中 ， 
通常 采用 线 下 实验 平台 的 方式 。 完 成 系统 设计 后 ,通过 实验 平台 提供 的 物理 I/O 与 系统 进 
行 交互 来 进行 系统 的 验证 。 由 于 物理 L/O 的 数量 通常 有 限 , 且 不 能 根据 需要 进行 方便 地 调 
整 ,限制 了 系统 调试 的 便利 性 。 而 目前 采用 线 上 FPGA 平台 的 方式 进行 组 成 原理 实验 教学 
时 ,更 多 的 做 法 还 是 将 线 下 的 实验 方式 搬 到 线 上 来 ,通过 摄像 头 监 控 的 方式 或 者 将 远程 的 
FPGA 平台 以 图 形 的 方式 展示 在 Web 界面 上 。 用 户 通 过 Web 页 面 的 虚拟 拨 码 开关 、LED 
等 方式 与 远程 的 FPGA 平台 进行 交互 。 这 种 方式 的 优点 是 直观 、 真 实感 强 , 学 生 能 感觉 到 
是 在 使 用 远程 的 FPGA 平台 进行 实验 。 但 由 于 物理 1/O 的 局 限 性 ,无 法 很 好 地 满足 不 同 实 
验 的 调试 需求 。 同 时 ,很 难 平滑 地 延伸 到 对 深度 学 习 加 速 器 设计 等 非 冯 “， 诺 依 曼 架 构 的 实 
验 教 学 中 ,因为 此 类 实验 通常 需要 更 复杂 的 1/O。 

随 着 人 工 智 能 和 大 数据 的 发 展 .Python 语言 已 发 展 成 为 深度 学 习 人 工 智 能 领域 最 炙 手 
可 热 的 编程 语言 , 越 来 越 多 的 学 校 和 机 构 开始 开设 Python 语言 。 本 书 介绍 采用 Python if 
言 进行 组 成 原理 实验 中 所 需 的 1/0O 功能 ,一 方面 可 以 提升 1/O 的 灵活 性 ,丰富 调试 手段 ; 另 
一 方面 ,利于 学 生理 解 软 硬件 协同 机 制 , 并 便于 进一步 扩展 到 深度 学 习 加 速 器 设计 等 非 
冯 。 诺 依 曼 架 构 的 实验 教学 。 

如 3. 2 节 最 后 一 段 所 述 ,Python 代码 可 以 运行 在 PS 端 并 和 PL 端的 用 户 硬件 模块 进 
行 交互 。Python 代码 可 以 灵活 的 方式 进行 不 同形 式 的 输入 、 输 出 工作 ,从 而 满足 不 同 的 硬 
件 系统 需求 。 
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CHAPTER 4 


Vivado 是 全 球 最 大 的 FPGA 芯片 提供 商 Xilinx 于 2012 年 发 布 的 集成 设计 环境 。 与 上 
一 代 开发 工具 ISE 相 比 ,Vivado 更 加 强调 对 软件 硬件 全 可 编程 的 支持 。 从 Xilinx 最 新 推出 
的 7 系列 芯片 (主要 包括 Artix-7、Kintex-7 和 Virtex 三 个 子 系列 ) 开 始 ,ISE 将 不 再 提供 支 
持 , 而 需要 采用 Vivado 开发 软件 。 在 采用 Vivado 进行 组 成 原理 实验 时 ,硬件 模块 或 系统 的 
设计 流程 如 下 所 述 。 


4.1 创建 工程 


在 Vivado 中 设计 一 个 自己 的 硬件 模块 或 系统 的 第 一 步 就 是 要 创建 一 个 工程 。 工 程 用 
来 组 织 用 户 开 发 中 的 所 有 要 素 : 如 源 文件 .IP、TCL 等 。 后 续 的 整个 开发 流程 就 是 基于 所 
创建 的 工程 开展 的 。 

下 面 的 开发 流程 是 以 Vivado 2018. 2 为 例 ,其 余 版 本 的 Vivado 使 用 与 其 差异 也 很 小 。 
创建 工程 首先 需要 提供 工程 名 与 工程 路 径 , 然 后 指定 用 到 的 工程 类 型 ,最 后 指定 工程 资源 文 
件 并 指定 工程 所 用 的 具体 FPGA 器 件 。 

1. 启动 Vivado 2018.2 

如 图 4-1 所 示 为 Vivado 启动 界面 。 

2. 选择 Create Project 新 建 工 程 

选择 Create Project 新 建 工程 ,进入 到 图 4-2 所 示 的 新 建 工程 向 导 界 面 。 在 此 为 新 建 的 
工程 命名 ,并 指定 工程 在 计算 机 上 的 位 置 路 径 。 注 意 路 径 中 不 要 使 用 中 文字 符 , 且 路 径 长 度 
不 要 超过 260 个 字 节 。 

工程 路 径 默 认 色 选 Create project subdirectory 用 于 创建 工程 子 目录 , 勾 选 后 会 创建 一 
个 文件 名 与 工程 名 相同 的 文件 夹 . 用 于 存放 整个 工程 。 如 果 选 择 不 勾 选 , 将 在 当前 文件 夹 下 
创建 工程 。 

3. 工程 类 型 选择 

填写 完 文件 名 及 路 径 后 , 单 击 Next 按钮 ,进入 到 图 4-3 所 示 的 工程 类 型 选择 界面 。 常 
规 的 工程 选择 为 RTL Project, Do not specify sources at this time 选项 用 来 选择 在 新 建 工 
程 过 程 中 是 否 指定 已 有 的 源 文件 。 如 果 勾 选 此 项 , 则 在 此 处 进行 工程 所 需 的 现 有 的 源 文件 
的 指定 ,将 会 连续 弹出 新 建 或 添加 已 存在 的 源 文件 .添加 已 存在 的 人 P、 新 建 或 添加 已 存在 的 
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图 4-1 Vivado 启动 界面 


Project Name 


Enter a name for your project and specify a directory where the project data files will be stored. , 


Projectname: project 1 


eene me E 


| Create project subdirectory 


Project will be created at F/RISCV/project 1 


© w) NEN (05 [9 


图 4-2 新 建 工程 向 导 界 面 


约束 文件 。 如 果 不 色 选 , 则 将 源 文件 的 添加 或 创建 活动 推迟 到 工程 建 好 之 后 。 在 此 以 不 需 
要 新 建 或 添加 任何 文件 为 例 ,所 以 这 里 选择 Do not specify sources at this time, Æ RTL T. 
程 建 好 之 后 ,可 以 再 新 建 添加 源 文件 .创建 Block Design, Æ IP 核 ,运行 RTL 分 析 、 综 合 、 
实现 ,布局 布线 。 
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天 New Project. 
Project Type 
Specify the type of project to create. $ 


© BTLProjed | 


You will be able to add sources, create block designs in IP Integrator, generate IP, run RTL analysis, synthesis, 
implementation, design planning and analysis. | 


Zi Do not specify sources atthis ime 


Postsynthesis Project You will be able to add sources, view device resources, run design analysis, planning and 
implementation. 


Do not specify sources atthis me 


Jo Planning Project 

Do not specify design sources. You will be able to view partipackage resources. 
Imported Project. 

Create a Vivado project trom a Synplity, XST or ISE Project File. 


Example Project 
Create a new Vivado project from a predefined template. 


图 4-3 工程 类 型 选择 界面 


4. 指定 所 用 的 FPGA 器 件 或 开发 板 

在 图 4-3 所 示 的 界面 上 单 击 Next 按钮 即 进入 图 4-4 所 示 的 界面 ,在 此 处 进行 本 工程 所 
用 的 FPGA 器 件 的 选择 ,所 选 的 器 件 后 续 还 可 以 进行 更 改 。 

此 处 的 Parts 指 的 就 是 FPGA 芯片 ,包含 了 Vivado 2018. 2 所 支持 的 芯片 型 号 。 而 
Boards 指 的 是 Vivado 2018. 2 所 支持 的 开发 板 。 如 PYNQ Z1/Z2 开发 板 所 用 的 芯片 型 号 
为 ZYNQ XC7Z020-1CLG400C, 所 以 可 以 直接 搜索 xc7z020clg400-1 添加 此 器 件 。 添 加 
Parts 和 Boards 的 区 别 是 : 直接 添加 Parts 后 还 需 自行 添加 PYNQ 引 脚 的 配置 文件 ,而 添 
加 Boards 后 不 需要 。 为 方便 起 见 , 这 里 直接 选择 Boards. 

需要 注意 的 是 ,由 于 Vivado 中 并 不 能 直接 选择 到 PYNQ, 因 此 要 在 Boards 中 选择 
PYNQ Z1/Z2 时 还 需要 自行 添加 PYNQ 的 支持 文件 Boardfiles。 从 Github: https:// 
github. com/xupsh/pynq-supported-board-file 处 可 以 下 载 Boardfiles ,解压 后 将 PYNQ Z1/ 
Z2 复制 到 Vivado 所 安装 的 路 径 下 ,如 D:\Xilinx\Vivado\2018.2\data\boards\board_files 
(此 处 Vivado 安装 在 DD 盘 ) 中 。 重 启 Vivado, 在 Boards 列表 中 就 会 看 到 PYNQ Z1/Z2 板 卡 
信息 ,如 图 4-5 所 示 。 

5 完成 工程 创建 

从 图 4-5 处 选择 pynq-z2, 单 击 Next 按钮 进入 图 4-6, 显 示 了 所 创建 的 工程 的 相关 信息 。 
单 击 Finish 按钮 即 完成 整个 工程 的 创建 。 

6. 进入 工程 界面 

工程 创建 完成 后 , 主 界面 如 图 4-7 所 示 。 左 侧面 板 为 设计 流程 的 管理 ,工程 的 源 文件 添 
加 、 综 合 、 仿 真 ,布局 布线 .生成 比特 流 等 操作 都 包含 在 设计 流程 管理 中 。 中 间 面 板 为 工程 源 
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F New Project € 
Default Part 
Choose a default Xilinx part or board for your project This can be changed later. [Li 


Parts | Boards 


Reset All Filters 


Category. All v Package: | All v | Temperature: All ~ 
Family. | All v Spet Al ~ 

Search: | Q- xc72020clg400-1 v | (1 maton) 

Part WOPinCount AvailablelOBs  LUTElements FlipFiops BlockRAMs  UlraRAMs DSPS Gt 
Xc72020c19400-1 400 125 53200 106400 — 140 0 220 0 


© <Back Net» Einish Cancel 


图 4-4 — Parts/ Boards 的 选择 界面 


È New Project imisa 
Default Part 


Choose a default Xilinx part or board for your project This can be changed later. [Li 


Pars | Boards 


Reset All Filters 


Search: | Q7 v 


Display Name Preview. Vendor 
ZedBoard Zynq Evaluation and Development Kit ^ 


Add Daughter Card Connections oni 
r- em.avnet com | 


Lor PINE 


@ =) NEM 


图 4-5 Boards 选择 列表 


pynqz2 


Cancel 


第 4 章 Vivado 


AUR 19 


f^ New Project 


VIVADO’ 


Hur Editions 


New Project Summary 
@ AnewRTL project named project 1' will be created. 


@ The detautt part and product family for tne new project 


Default Board: pynq-z2 


Default Part xc72020cig400-1 


Product Zyng-7000 
Family. Zynq-7000 
Package: dg400 
Speed Grade: -1 


€ XILINX. 
© 


To create the project, click Finish 


Net > 


Cancel 


图 4-6 所 创建 的 工程 信息 页 面 
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Aa Sourcns - 
Design Sources 
Language Templates Constans 
PF pealog 


PINTEGRATOR 


Create Bock Design 


smuumon 


Runsmuaaon 


v RAUS 
2. Open Elaborted Design 


reci samanay 


Somos Es 
Pomaname Lr] 

Promdlocion ~ ERsicypd2 
Proosatamer 2700 

Proiciont ea d iro) 
Tepmeddename Notouned 
Tapeleguge wee 


Semidelrgage Wed 


图 4-7 Vivado 工程 界面 


文件 ,包括 设计 源 文件 . 引 脚 约 束 文件 .仿真 文 件 的 选择 面板 。 


[ICT v 


FF Rais URAM OSP Stt Elapsed Rin aegy 


Waco Spests Das 
Vado implementation Der 


右 侧面 板 为 具体 操作 界面 ,以 


及 工程 信息 ,包含 板 卡 信息 .FPGA 资源 利用 率 等 概要 信息 。 下 部 的 面板 为 各 种 信息 的 输 


出 ,包含 编译 信息 ,报告 等 。 
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4.2 设计 输入 


设计 输入 就 是 用 户 采用 什么 样 的 方式 进行 具体 开发 ,在 计算 机 组 成 原理 实验 的 开发 中 ， 
通常 可 以 采用 原理 图 或 Verilog/VHDL 的 方式 进行 设计 输入 。 


4.2.1 原理 图 方式 


所 谓 原理 图 方式 ,就 是 通过 画 电 路 图 的 方式 非常 直观 地 设计 一 个 功能 模块 或 系统 。 在 
Vivado 里 面 可 以 使 用 图 4-7 工程 界面 左 侧 的 IP Integrator 下 的 Block Design 进入 原理 图 
设计 。 采 用 原理 图 方式 开发 时 ,可 以 添加 各 种 IP 核 ( 已 有 的 功能 模块 ) ,再 进行 连 线 配置 。 
使 用 图 形 化 的 开发 方式 ,就 像 在 FPGA 上 搭建 积木 一 样 ,非常 直观 方便 。 

下 面 以 Vivado 自 带 的 IP 核 加 减法 器 (Adder/Subtracter IP) 为 例 ,介绍 Vivado 的 原理 


图 开发 方式 。 
在 Vivado 工程 新 建 完成 后 , 单 击 左 侧 Create Block Design 新 建 原理 图 ,进入 如 图 4-8 
所 示 的 界面 。 
pei Mpeietlmpü-Yde !!2 ae — Wm — we "-— oe o 00 — FERES e e $022 
ett mnis 
PROJECT MANAGER project 2- ?Px 


?DGx 


az . 

Denn Source 
Conamana 
Samon Sources 

Mera Loranes  Compis row 

Properes 

~ smutnou 
Run Smmuaton 

TeiCoescie | Messages |Log |Hapors | Dosspa Runs 7-05 

azoli » 十 | % 

Name Coraes Sta WS mS WHS THS TPWS ToaPower FaleiRouss LUT FF BRA URAM OSP Stat Elapsed Run Byahoy 
ambo! consent Notstated Vado Sess Das 


imei cmi d Netsiried ago implementation Der 


图 4-8 原理 图 新 建 界面 


为 该 原理 图 命名 后 , 单 击 OK 按钮 进入 图 4-9。 在 图 4-9 中 的 Diagram 中 碳 击 ,选择 
Add IP 添加 IP 核 ,搜索 想 要 添加 的 IP 模块 名 字 Adder/Subtracter。 双 击 进行 确认 ,添加 加 
法 器 /减法 器 IP 核 , 即 成 功 添 加 了 加 减法 器 的 IP 核 , 如 图 4-10 所 示 。 

双击 Adder/Subtracter IP 核 或 者 右 击 ,选择 Customize Block ,可 以 对 IP 核 进 行 配置 ， 
如 图 4-11 所 示 。 用 户 可 以 根据 需求 调整 IP 的 具体 参数 ,例如 可 选择 使 用 FPGA 逻辑 单元 
还 是 使 用 DSP48 单元 进行 加 减法 的 运算 ,并 通过 Information 查看 IP 核 占 用 的 资源 估算 。 
在 IP 核 配置 窗口 , 单 击 左 上 角 Document 可 查看 与 IP 核 相 关 的 技术 手册 。 


Diagram x Address Editor x| 


al&aixzixiolaizieileis|^igi»c 
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图 4-9 添加 IP 的 界面 


Diagram x Address Editor x 
Q QaIXIN/O Q Z$ ^"|*4Ggiscis 


# Designer Assistance available. Run Connection Automation 


c addsub 0 


 Adder/Subtracter 


图 4-10 原理 图 开发 界面 
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为 了 使 该 原理 图 可 以 和 外 部 1/0 相连 接 , 需 要 将 其 引 脚 * 引 出 *。 如 : 将 输入 A 引 脚 选 
中 , 右 击 ,选择 Make External, 可 以 看 出 图 4-12 中 输入 A 引 脚 出 现 了 输入 的 箭头 图 标 , 表 
示 其 可 以 接收 外 部 的 输入 了 。 依 次 选中 引 脚 , 右 击 ,选择 Make External 将 其 引出 。 如 果 想 
要 将 同一 组 输入 连接 到 多 个 输入 引 脚 ,如 AB 端口 都 连接 到 同一 组 输入 A_0[14:0], 可 以 
先 将 A 引出 ,然后 将 B 连接 到 A 端口 .出现 绿色 对 号 的 标志 ,表示 人 允许 连接 。 

原理 图 连接 并 将 引 脚 引出 完毕 之 后 ,可 以 在 Diagram 中 右 击 ,选择 Validate Design 或 
者 在 Diagram 顶层 菜单 栏 中 单 击 Validate Design 按钮 或 者 按 F6 键 ,对 原理 图 进行 验证 , 确 


保 连 接 无 误 。 


为 了 使 原理 图 方式 设计 的 IP 也 能 在 使 用 Verilog/VHDL 方式 开发 时 被 调用 ,可 以 将 
原理 图 封装 成 HDL 的 格式 ,后 续 可 以 通过 调用 该 HDL 封装 文件 调用 到 对 应 的 原理 图 IP。 
具体 操作 如 下 : 右 击 ,选择 Design Source 中 需要 HDL 封装 的 原理 图 文件 ,如 : design 1. bd. 
选择 Creat HDL Wrapper, 弹 出 图 4-13 所 示 界 面 。 其 中 Copy generated wrapper to allow 
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AdderiSubtracter (12.0) f 
Eeoae 
WP Symbol information Component Name c addsun 0 ] 
Snow dsatied pons 
Basie comot 
Implementusng [Fanne z 
= A + B 
oa Type u [E TI 二 区 到 
nput Wian mss ese afs | P258 
I jas > 
Output Width 15 © nsa 
AL1401 Latency Connguraon manual E 
EPXU ne Laien 1 9 ns 
CLK 
Constant input 
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Constan pr) [DOO000000000000 77 
ox Cancel 
图 4-11 IP 配置 界面 
c addsub 0 c addsub 0 
A 0[14:0] A 0[14:0] [ES 
ly il 
cko D S_0[14:0] 


CE Connect from 'B' port to 'A_0_1 net CE 0 BD 


"Adder/Subtracter 'Adder/Subtracter 
图 4-12 原理 图 引 脚 的 “引出 ” 
页 Create HDL Wrapper I) Moe SUL] 
— 
ene Li 
You can either add or copy the HDL wrapper file lo the project Use copy option if Design Sources (1) 
you would like to modify his file. d lesga 1, wrapper (sesion 5 wrapper t1) 
AJR design. LJ: design. 1 (Geslpn. 1 63) 7) 
v € design 1(design 1:0 (1) 
Options PE c agasun_0: design. 7 c addsub 0 1 (ad 
Consrants 
O Copy generated wrapper to allow user edits Simaion Sources (9) 


(© Let Vivado manage wrapper and auto-update 


© EN e 


图 4-13 生成 HDL 封装 
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user edits 意思 是 使 用 者 后 续 具 有 修改 该 wrapper 的 权利 ,而 选择 Let Vivado manage 
wrapper and auto-update, 意 思 是 由 Vivado 来 管理 并 且 自 动 更 新 该 wrapper', 而 单纯 地 使 用 
者 将 不 能 自行 修改 。 


4.2.2 Verilog/VHDL 方式 


Vivado 在 支持 原理 图 开发 方式 的 同时 ,也 支持 硬件 描述 语言 Verilog/VHDL 的 开发 方 
式 。 这 里 将 以 简单 的 LED 控制 为 例 ,说 明 如 何 使 用 硬件 描述 语言 Verilog/VHDL 进行 
开发 。 

在 工程 创建 完成 之 后 , 右 击 , 选 择 Design Source 选择 Add Sources 添加 或 创建 设计 文 
件 。 如 图 4-14 所 示 ,选择 Create File, 创 建 名 为 led. v 的 Verilog HDL 源 文件 。VHDL W 
文件 的 后 级 名 为 . vhd。 


Add Sources ===} Ez J 
Z — — 
Add or Create Design Sources 
Specify HDL netlist, Block Design, and IP fles,| > Create Source File s e ES). anewsourcefieon Ø 
disk and add itto your project 
Create a new source file and add it to your 
project 
*-t15 
Eile type: @ verilog v 
Filename: |edy e 
File location: | &: «Local ta ~ 
udi | 文件 名 
@ ET 
" 
AddFiles Add Directories. Create File 
Scan and add RTL jnclude files into project 
Cop s into project 
Z| Add sources from subdirectories 
© -me | [nea | [ Eme ] [cana 
一 


图 4-14 创建 HDL 文件 


选择 Finish 后 ,Vivado 会 弹出 如 图 4-15 所 示 的 Define Module 对 话 框 , 用 户 可 在 此 定 
义 模块 名 称 和 I/O 引 脚 ,也 可 以 简单 地 跳 过 ,后 续 在 源 文件 中 直接 通过 代码 方式 定义 。 

确定 之 后 即 可 进入 该 led. v 源 文件 的 编辑 界面 ,如 图 4-16 所 示 。 在 此 完成 源 代码 的 
编写 。 

为 了 将 该 模块 在 其 他 设计 中 以 原理 图 的 方式 被 调用 .或 在 被 其 他 设计 调用 时 不 看 到 源 
代码 ,可 以 选择 将 上 述 Verilog 编写 的 模块 打包 成 IP。 通 过 选择 Create and Package New 
IP 打 包 IP 核 。 在 此 之 前 需要 将 led. v 设置 为 顶层 文件 。 如 果 不 需 要 , 则 可 以 再 开发 中 直接 
使 用 . v X ff. 

创建 和 打包 IP 时 ,可 选择 将 整个 项 目 、 当 前 的 Block Design 或 指定 的 目录 进行 打包 
( 见 图 4-17) ,还 可 创建 AXI 的 总 线 接口 。 


| 


台 教 学 与 实践 
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4. Define Module I L 
— 一 一 人 
Define a module and specify VO Ports to add to your source file. 
For each port specified: 
MSB and LSB values will be ignored unless its Bus column is checked. $ 


Ports with blank names will not be written. 


Module Definition 
VO Port Definitions. 
--tf5 | 
PortName  Direcion Bus LSB 
input v 


@ EN — 


x == 


图 4-15 模块 定义 对 话 框 


//Verilog 代码 示例 
module led(input [3:0] sw, output [3:0] led); 
assign led = sw; // 将 sw 端口 直接 与 led 相连 


endmodule 
图 4-16 Verilog 示例 源 代码 
|... Project. 2 - [E/RSICV/project. 2/project.2xpr] = Vivado 2018.2 i 


Ele Edt Flow Tools Repons Window Layout View Help | 


[M Validate Design 


Flow Navigator 


Create and Package New IP... 
Create Interface Definition. 


M RTLANALYSIS Enable Partial Reconfiguration. 
> Open Elaborated D| Run Td Script 


Property Editor. 


~ SYNTHESIS 
P Run Synthesis 


Associate ELF Files... 


Generate Memory Configuration File. 


> Open Synthesized d 


Compile Simulation Libraries. 


Xilinx Tcl Store. 


Y IMPLEMENTATION 


Custom Commands » 


P> Run Implementatiol 
Q Language Templates 


~ Open Implemented 


Q9 Settings. 
Constraints Wire 


图 4-17 PHE 


指定 IP 输出 的 位 置 ,在 图 4-18 选择 “. xci” 文 件 ,这 是 定制 IP 输出 的 文件 ,该 文件 包含 
了 定制 IP 核 的 所 有 信息 ,可 以 通过 这 个 文件 使 用 需要 的 IP 核 。 

如 果 选 择 “Include IP generated files” 则 是 包含 所 有 IP 生成 的 文件 。 单 击 Next 按钮 
后 , 单 击 Finish 按钮 完成 创建 IP 核 。 生 成 后 需要 设置 打包 IP 核 配置 信息 ,最 后 选择 
Review and Package. Package IP 完成 IP 的 创建 与 打包 。 
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aa = "3 
I create and Package New IP mn | - WEB c ES) 
Package Your Current Project 
Select the directory where the IP Definition will be created and the associated options for packaging the current project. P 
IP location: ejrsicuproject 3. packipiprojedt 3. packip.srcsisources, iinew ol] 


i Packaging IP in the project. 


W © Include xci files | 
I D Include IP generated files 

li 

| 

ii 

中 

! | 


|o EH — 0 


图 4-18 IP 打包 时 的 选项 


为 了 能 够 在 使 用 时 调用 到 上 述 产生 的 IP, 需 要 将 IP 核 添加 到 库 中 。 在 Block Design 
中 右 击 ,选择 IP Setting, 如 图 4-19 所 示 选 中 Repository, 将 上 述 IP 添加 进来 。 之 后 在 使 用 
时 便 可 在 Block Design 中 添加 该 用 户 定义 的 IP 核 ,注意 设置 路 径 为 IP 核 存放 路 径 。 


IP » Repository 
Project Settings Add directories to the list of repositories. You maythenaddaddionallIPloa Of 
General selected repository. Ifan IP is disabled then a loop will alert you to the reason. 
Simulation 2 E 
Elaboration IP Repositories 
Synthesis. *-Íl-it|is5 
Implementation 
Bitstream 
vp 
Repository 
Packager 


Refresh All 由 


Tool Settings 
! Project 

IP Defaults 
Source File. 
Display 
WebTalk 


Help 
> Text Editor. 

3rd Party Simulators 
> Colors 


Selection Rules 
Shortcuts ~ 


© EN o] | | [ee 


图 4-19 添加 IP Repository 
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4.3 仿真 


上 述 介 绍 了 如 何 通过 不 同 的 方式 设计 一 个 功能 模块 ,在 完成 设计 之 后 需要 快速 验证 该 
模块 是 否 正确 。 为 了 及 时 快捷 地 验证 所 设计 的 模块 的 正确 性 ,通常 在 下 板 之 前 先 要 对 系统 
进行 仿真 。 尤 其 是 功能 仿真 ,是 组 成 原理 实验 中 经 常用 到 的 手段 。 

在 进行 仿真 时 ,通常 的 做 法 是 设计 一 个 测试 文件 ,通过 该 文件 产生 模块 所 需要 的 激励 输 
入 信号 ,并 观察 模块 的 输出 。 该 测试 文件 就 叫 Testbench。 

本 节 以 验证 4. 2. 2 节 中 led 模块 为 例 ,介绍 Testbench 如 何 创建 ,编写 以 及 如 何 通 过 加 
载 Testbench 对 模块 进行 仿真 。 

1. 创建 Testbench 

在 工程 主 界面 的 Design Source 中 添加 Testbench. 在 Source 中 右 击 ,选择 Add 
Source, 然 后 选择 如 图 4-20 所 示 的 Add or create simulation sources。 选 择 Create File 创建 
Testbench 文件 , 即 可 进入 Testbench 编辑 界面 。 


Ò AddSources api m wm e & E x 5 =z) 
f Add Sources 
VIVADO This guides you through the process of adding and creating sources for your 
project 
Add or create constraints 
Add or create design sources | 


© Add or create simulation sources 


€ XILINX. 
M © Back Em Finish Cancel 


图 4-20 建立 Testbench 文件 


2. 编写 Testbench 

编写 Testbench 的 目的 就 是 为 待 仿真 的 模块 提供 输入 并 获取 输出 。 在 Testbench 中 可 
以 为 输入 变量 设 定 不 同 的 值 , 而 且 可 以 为 其 设 定时 间 。 

举例 说 明 : 用 来 仿真 led 模块 的 Testbench 示例 代码 如 下 : 


module sim( //Testbench 模块 名 ,为 顶层 模块 且 没 有 输入 /输出 
); 
reg [3:0] sw; //Testbench 内 部 变量 
wire [3:0] led; //'Testbench 内 部 变量 
initial begin 
sw = 4'b0000; // 在 仿真 时 刻 0, 为 sw 指定 输入 值 : 4 位 的 二 进 制 0000 
end 


initial begin 
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#20 // 延 时 20 个 时 间 单 位 
sw= 4'b0001; // 在 仿真 时 刻 20 时 ,修改 sw 的 输入 值 为 0001 
#20 // 延 时 20 个 时 间 单 位 
sw= 4'b0010; // 在 仿真 时 刻 40 时 ,修改 sw 的 输入 值 为 0010 
#20 // 延 时 20 个 时 间 单 位 
sw= 4'b0100; // 在 仿真 时 刻 60 时 ,修改 sw 的 输入 值 为 0100 
#20 // 延 时 20 个 时 间 单 位 
sw= 4'b1000; // 在 仿真 时 刻 80 时 ,修改 sw 的 输入 值 为 1000 
end 
led led 1(.sw(sw), .led(led)); ”// 将 Testbench 的 内 部 变量 与 待 验证 的 led 模块 的 
// 输 入 /输出 相连 
Endmodule 


3. 运行 仿真 

Testbench 编写 完成 后 ,在 左 侧 工程 管理 栏 中 选择 Simulation Run Simulation 可 进行 
仿真 验证 。 

Run Simulation 有 五 种 仿真 模式 ,可 根据 需要 进行 选择 。 

(1) Run behavioral simulation: 行为 级 仿真 ,通常 也 称 为 前 仿真 或 功能 仿真 ,是 对 设计 
输入 的 直接 仿真 。 

(2) Post-synthesis function simulation: 综合 后 的 功能 仿真 。 
宗 合 后 带 时 序 信 息 的 仿真 ， 

(4) Post-implementation function simulation: 针对 具体 FPGA 芯片 实现 之 后 的 功能 
仿真 。 

(5) Post-implementation timing simulation; 针对 具体 FPGA 芯片 实现 之 后 的 时 序 仿 
真 ,该 仿真 最 接近 真实 的 时 序 波形 。 

在 组 成 原理 实验 中 ,通常 综合 前 或 综合 后 的 功能 仿真 即 可 。 在 此 运行 行为 仿真 (run 
behavioral simulation) 后 可 查看 波形 ,如 图 4-21 所 示 。 可 以 通过 查看 波形 根据 输入 /输出 的 
变化 验证 模块 的 功能 。 


(3) Post-synthesis timing simulation: 


aze o a o 
Name Designu.. BlockType Name Vawe 
Osm sm Verog M. ws. 8 
Bi ode Veniog M. wii. 8 
Bou gu Verilog M. 


图 4-21 led 模块 的 功能 仿真 结果 
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Scope 面板 可 选择 要 仿真 的 模块 ,选择 后 仿真 的 输入 /输出 便 会 出 现在 Objects 面板 中 ， 
如 图 4-22 所 示 。 

在 Objects 面板 中 ,可 选择 Add to Wave Window 添加 需要 观察 的 信号 到 仿真 窗口 ,如 
图 4-23 所 示 。 仿 真 波形 的 观察 可 以 通过 窗口 的 推拉 进行 缩放 。 


Value Data Type 


| Addto Wave Window 


| Log to Wave Database 


Show in Wave Window 


Go to Source Code 


Radix 


Eorce Constant. 
Force Clock. 
Remove Force 


Default Radix 


图 4-22 仿真 模块 的 选择 图 4-23 观察 信号 波形 的 添加 


仿真 时 ,可 根据 需要 进行 Restart, Run All( 一 直 运 行 )、Run for 10us( 限 时 运行 )、Step、 
Relaunch Simulation 等 操作 控制 仿真 的 时 间 。 


4.4 综合 


不 管 是 原理 图 方式 还 是 Verilog/VHDL 方式 的 设计 输入 ,都 需要 经 过 综合 后 才能 进行 
后 续 的 布局 布线 以 及 板 级 实现 等 。 所 谓 综合 ,就 是 将 电路 原理 图 或 者 硬件 语言 描述 文件 装 
换 成 综合 网 表 的 过 程 。 综 合 网 表 中 除了 包含 与 门 、 非 门 等 组 合 迎 辑 和 寄存 器 等 时 序 逻 辑 之 
外 ,还 包含 FPGA 特有 的 各 种 原 语 (Primitive) ,例如 LUT、BRAM、DSP48, 其 至 PowerPC, 
PCIe 等 硬 核 模块 ,以 及 这 些 模块 的 属性 和 约束 信息 。 

选 定 一 个 模块 进行 综合 之 前 ,需要 将 其 设置 为 顶层 模块 。 如 果 使 用 原理 图 方式 进行 设 
计 , 还 需要 对 其 进行 打包 ,再 进行 综合 ,如 图 4-24 所 示 。 然 后 选择 Flow Navigator 中 的 Run 
Synthesis 进行 综合 。 

如 果 综 合 出 现 错误 , 则 需要 根据 提示 进行 相应 的 设计 修改 。 综 合成 功 后 可 根据 提示 查 
看 综合 设计 以 及 综合 报告 。 上 述 led 模块 综合 后 的 原理 图 ,如 图 4-25 所 示 。 

综合 后 可 在 Reports 面板 中 打开 report_utilization 查看 详细 的 资源 利用 率 等 信息 ,以 及 
在 synthesis_report 中 查看 综合 过 程 的 相关 信息 。 在 较为 复杂 的 设计 中 ,通常 需要 借助 综合 的 
报告 调整 自己 的 设计 。 当 然 在 工程 管理 栏 的 Synthesis 中 可 以 查看 更 详细 的 综合 报告 。 
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Hierarchy | IP IP Hierarchy , 
we SetasTop 
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图 4-24 综合 前 准备 
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图 4-25 led 模块 综合 后 的 原理 图 


4.5 引 脚 绑 定 (MO 处 理 ) 


经 过 上 面 的 输入 设计 及 综合 之 后 ,用 户 完成 了 一 个 功能 模块 的 设计 。 虽 然 该 功能 模块 
在 仿真 时 可 以 借助 Testbench 给 它 加 载 输入 信号 并 通过 Testbench 读 取 它 的 输出 信号 ,但 
当 把 它 下 载 到 FPGA 芯片 时 , 它 还 是 一 个 没有 与 外 部 连接 起 来 的 孤立 的 模块 。 因 此 ,在 下 
载 之 前 , 先 要 为 其 进行 “ 引 脚 绑 定 操作。 如 图 4-26 所 示 ,“ 引 有 和 脚 绑 定 ” 的 意思 就 是 将 用 户 设 
计 的 功能 模块 的 逻辑 输入 /输出 和 FPGA 芯片 的 物理 T/O 引 脚 (如 PL 端 与 LDO 一 LD3 连 
接 的 引 脚 ) 或 监控 模块 (如 与 PYNQ 的 PS 端 连接 的 通道 ) 的 输入 /输出 连接 起 来 ,以 便 通 过 
FPGA 的 物理 引 脚 连接 的 外 设 或 监控 模块 (可 以 通过 Python 程序 ) 对 用 户 的 模块 进行 输入 / 
输出 ,从 而 完成 用 户 模 块 的 运行 及 测试 验证 。 


PYNQ 开 发 板 


LD3 


核心 芯片 : ZYNQ 


LD2 
XC7Z020-1CLG400C 


PS PL LDI 
Python < X LDO 
程序 


图 4-26 引 脚 绑 定 示 意图 
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4.5.1 物理 引 脚 的 绑 定 


以 PYNQ 开发 板 为 例 , 当 需要 把 用 户 模块 的 IVO 与 PL 部 分 的 物理 引 脚 进行 绑 定 时 ， 
Vivado 支持 直接 编写 约束 文件 . xde 进行 引 脚 约 束 。 可 在 Design Source 中 的 Constraints 
中 新 建 引 脚 约束 文件 . xde 并 根据 需要 进行 编写 。 同 样 支持 综合 后 在 L/O Ports 面板 中 对 1/0 
进行 绑 定 。 在 工程 综合 完成 后 ,选择 左 侧 SYNTHES 中 的 Open Synthesized Design. 再 
选择 右上 角 下 拉 菜 单 , 单 击 I/O Planning 进行 引 脚 绑 定 ,操作 如 图 4-27 所 示 。 


YE E 


e 


定 ， 


图 4-27 综合 后 的 设计 


也 可 以 通过 如 图 4-28 所 示 界 面 选 择 Vivado 菜单 栏 
Layout-*1/O Planning 对 引 脚 进行 绑 定 。 

如 图 4-29 所 示 ,在 L/O Ports 面板 中 可 对 约束 引 脚 IO m e 
电 平 标准 以 及 其 他 进行 相关 配置 。 引 脚 设 置 需要 参考 zad 25 | Floorplanning » 


Layout View Hep | Q- oul 


Default Layout 


PYNQ 原理 图 将 对 应 引 脚 进行 连接 。PYNGQ 原理 图 和 其 LÀ zs oem n 

他 PYNQ 相关 文档 可 在 http://www. tul. com. tw | Timng inani 

ProductsPYNQ-Z2. html 中 下 载 。 区 Sin Uno n 
4.5.2 与 监控 模块 (PS) 的 连接 le] 


std 


除了 与 PL 的 引 脚 直接 相连 进行 输入 /输出 外 .在 基于 Resettayout 
PYNQ 的 开发 中 ,也 可 以 通过 将 功能 模块 与 PS 端 相连 ,从 而 
通过 PS 端 运 行 的 Python 软件 完成 PL 上 功能 模块 的 输入 
输出 。 

1. PS/PL 连接 通道 介绍 

我 们 知道 ,在 基于 PYNQ 的 组 成 原理 实验 中 ,用 户 的 硬件 模块 是 在 PL 中 运行 的 。 如 
果 想 把 PS 端 作为 监控 模块 并 在 PS 上 运行 Python 与 PL 端的 用 户 模块 进行 交互 ,就 需要 将 
PL 中 的 用 户 模 块 的 1/0O 5 PS 端 连接 起 来 。 

PYNQ 的 核心 芯片 Zynq SoC 芯片 中 PL 5 PS 之 间 的 连接 有 如 下 几 种 物理 通道 ,如 
图 4-30 所 示 。 


图 4-28 选择 输入 /输出 布局 
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图 4-29 1/O Ports 的 布局 
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图 4-30 ”PS 和 PL 的 物理 连接 通道 


图 中 的 Zynq 在 PS 和 PL 之 间 有 若干 个 AXI 接口 。Zynq SoC 芯片 的 PL 与 PS 之 间 有 
4 个 32 位 的 GP(General Purpose) 通 道 .4 个 64 位 的 HP(CHigh Performance) 通 道 、1 个 64 
位 的 ACPCAccelerator Coherency Port) 通 道 以 及 2 个 32 位 的 GPIO 通道 PS 和 PL 可 以 
分 别 以 主 (M，Master) 或 从 (S, Slave) 的 方式 来 使 用 上 述 通道 。 从 设备 只 能 被 主 设备 控制 ， 
而 不 能 对 主 设备 控制 。 物 理 连 接 通 道内 的 功能 如 下 : 

(1) GP Port 最 大 读 写 数据 宽度 为 32 位 。 不 支持 AXI 的 突 发 模式 ,比较 适合 少量 的 数 
据 传输 。 

(2) HP Port 最 大 读 写 数据 宽度 为 64 位 。 支 持 AXI 的 突 发 模式 ,适合 大 量 的 数据 传 
输 。 可 访问 PS 端的 DDR 和 OCM(On-Chip Memory) 。 
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(3) ACP Port 可 直接 访问 PS 端的 Cache。 通 过 该 接口 PL 端的 逻辑 可 以 直接 访问 PS 
端的 Cache, mi H. Cache 一 致 性 由 SCU 模块 保证 。 因 此 PL 逻辑 可 以 直接 从 Cache 中 拿 到 
CPU 的 计算 结果 ,同时 也 可 以 第 一 时 间 将 逻辑 加 速 结果 送 至 CPU Cache 中 ,因此 其 延 时 很 
小 ,适合 作 专 用 指令 加 速 模块 接口 。 

(4) GPIO 是 一 个 非常 简单 的 接口 ,不 需要 复杂 的 地 址 映射 。 从 PS 到 PL 有 多 达 64 个 
GPIO(EMIO) ,PS 与 PL 可 直接 进行 交互 ,使 用 简单 方便 。 可 用 作 一 些 控制 信号 如 复位 、 中 
断 等 ,PL 中 不 需要 IP 就 可 以 使 用 它们 。 

其 他 几 种 可 以 用 于 管理 Zynq PS 和 PL 接口 间 数 据 移动 的 方式 : 

(D MMIO(Memory Mapped 10): 任何 连接 到 AXI GP 从 端口 的 IP 都 将 映射 到 系统 
内 存 映 射 中 ,可 以 使 用 MMIO 读 取 / 写 人 内 存 映射 位 置 。MMIO 读 或 写 命令 是 单 次 传输 32 
位 数据 到 内 存 位 置 或 从 内 存 位 置 读 出 数据 。 由 于 不 支持 突 发 指令 ,MMIO 最 适合 在 IP 连 
接 到 AXI GP 从 端口 之 间 读 写 少 量 数据 。MMIO 允许 Python 对 象 访问 映射 到 系统 内 存 中 
的 地 址 ,特别 是 可 以 访问 PL 中 外 设 的 寄存 器 和 地 址 空间 。 

(2) XInk( Memory allocation) XInk 用 于 分 配 连续 内 存 。 连 接 到 AXI HP 主 端口 或 
ACP 主 端 口 的 IP 可 以 访问 PS DRAM., 在 PL 中 的 IP Uil] DRAM 之 前 ,必须 先 分 配 ( 保 
留 ) 一 些 内 存 供 IP 使 用 ,以 及 传递 给 IP 的 内 存 的 大 小 和 地 址 。Python 或 Numpy 中 的 数组 
将 分 配 到 虚拟 内 存 中 的 某 个 位 置 。 分 配 内 存 的 物理 内 存 地 址 必须 在 PL 中 提供 给 IP。Xlnk 
可 以 分 配 内 存 , 也 可 以 提供 物理 指针 , 它 还 可 以 分 配 连续 内 存 以 便 PL IP 更 有 效 使 用 。 
XInk 可 以 使 用 Python NumPy 包 分 配 数 组 。 允 许 使 用 NumPy 指定 数组 的 数据 类 型 和 大 
小 /形状 。DMA 也 隐 式 地 使 用 XInk 来 分 配 内 存 。 

(3) DMA (Direct Memory Access) AXI 接口 通常 用 于 高 性 能 流 应 用 程序 。AXI 可 以 通 
it DMA 5j Zynq AXI HP 端口 一 起 使 用 。Pynq 中 的 DMA 支持 AXI 直接 内 存 访问 IP. fe 
许 其 从 DRAM 中 读 取 写 人 数据 。 

Zynq 支持 三 种 AXI 总线 ,分 别 为 : 

(4) AXI4: 用 于 高 性 能 内 存 映射 方式 的 通信 需求 ,允许 最 大 256 的 数据 突 发 传输 。 

(5) AXI4-Lite: 用 于 简单 的 低 吞 吐 率 的 内 存 映 射 方式 通信 和 需求 ,是 一 个 轻 量 级 的 地 址 
映射 单 次 传输 接口 ,占用 很 少 的 逻辑 单元 。 

(6) AXI4-Stream: 用 于 高 速 流 数 据 传输 .允许 无 限制 的 数据 突 发 传输 模式 。 

从 图 4-30 中 可 知 : 

PL 端 有 4 个 AXI Master HP 接口 .2 个 AXI Master GP 接口 .2 个 AXI Slave GP 接口 
和 1 个 ACP Master 接口 。 

PS mA 4^ AXI Slave HP 接口 ,2 个 AXI Master GP 接口 .2 个 AXI Slave GP 接口 
和 1 个 ACP Slave 接口 。 

因此 ,与 监控 模块 (PS) 的 连接 主要 是 如 何 将 用 户 设 计 的 模块 的 1/0O 与 PS 端的 几 种 接 
口 进行 连接 的 问题 。 

本 书 使 用 GPIO 来 连接 PS 和 PL。Zynq 中 有 两 种 实现 GPIO 的 方式 : 一 种 是 使 用 PS 
GPIO( 分 为 MIO 和 EMIO 两 种 ) ,另外 一 种 是 在 PL 中 加 入 AXI_GPIO IP 核 (IP 方式 ) 。 
本 书 使 用 的 是 AXI_GPIO IP。 

* MIO Ji X: Zynq 7000 系列 芯片 有 54 个 MIO, 它 们 分 配 在 GPIO 的 Banko 和 
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Bankl.Xf PL 透明 。 
* EMIO Jr X: EMIO 有 64 个 引 脚 可 以 使 用 ,它们 分 配 在 Bank2 和 Bank3 上 ,和 PL 
相连 ,如 图 4-30 所 示 。 无 论 MIO 还 是 EMIO 都 属于 PS 上 的 IO ,直接 由 PS 操作 。 
* IP 方 式 : AXI GPIO 是 通过 AXI 总 线 挂 在 PS 上 的 GPIO, PS 端 通过 M AXI GP 
接口 来 控制 PL 端 AXI GPIO IP 模块 ,调用 时 占用 相应 AXI 总 线 地 址 空间 。 
虽然 IP 方式 占用 PL 资源 ,但 是 其 优点 是 引 脚 资源 丰富 和 使 用 灵活 方便 。 因 此 本 书 使 
用 IP 方 式 实 现 GPIO。AXI_GPIO 模块 见 图 4-31, 每 个 AXI_ axi gpio 0 
GPIO 最 多 可 以 有 两 个 通道 ,每 个 通道 最 多 有 32 个 引 脚 。AXI_ 
GPIO 左 端 与 PS 通过 AXI 总 线 相连 ,其 右 端 与 用 户 模 块 相 连 。 
第 5 章 “ 基 于 Python 的 1/0 交互 ”将 会 进一步 介绍 如 何 采 
用 Python 编码 通过 对 PS 端 接口 的 控制 完成 对 PL 端 用 户 模 块 
的 输入 和 输出 。 
2. 与 PS 的 连接 
在 基于 PYNQ 的 计算 机 组 成 原理 实验 中 ,最 直接 的 方式 是 将 用 户 模 块 通过 GPIO 与 
PS 端 连接 ,并 通过 在 PS 端 运行 Python 对 GPIO 进行 操作 完成 对 PL 中 用 户 模块 的 输入 / 
输出 。 具 体 介绍 如 下 : 
在 完成 用 户 模块 设计 ,需要 将 其 与 PS 进行 连接 时 , 单 击 左 侧 Create Block Design 打开 
新 建 原理 图 对 话 框 ,如 图 4-32 所 示 。 


AXI GPIO 
图 4-31. AXI GPIO 模块 
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图 4-32 新 建 原理 图 对 话 框 


如 图 4-33 所 示 , 右 击 , 选 择 Add IP 输入 ZYNQ7 Processing System ,添加 ZYNQ7 
Processing System IP 核 。 它 代表 的 是 Zynq7000 SoC 芯片 中 的 PS 端 。 如 图 4-34 Bros ,在 
此 调 出 后 可 以 以 原理 图 的 方式 操纵 它 与 用 户 模块 的 连接 ,当然 还 需要 添加 其 他 中 间 模 块 。 

单 击 Run Block Automation. 自动 将 DDR 5j FIXED IO 进行 配置 ,并 将 PYNQ 的 
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图 4-33 添加 ZYNQ? Processing System IP 
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图 4-34 ZYNQ7 Processing System 的 原理 图 方式 


ZYNQ Block Design 进行 默认 配置 。 

右 击 ,选择 Add IP 添加 AXI GPIO 模块 。 如 图 4-35 Bros ,用 来 提供 与 PL 上 的 用 户 硬 
件 模块 连接 的 GPIO 接口 。PS 的 M_AXI_GP0 与 AXI GPIO 模块 的 S AXI 相连 ,也 就 是 
说 AXI GPIO 是 通过 PG 通道 来 连接 的 。AXI GPIO 模块 的 GPIO 引 脚 与 PL 中 的 用 户 模 
块 相连 。 

Run Block Automation 是 Vivado 根据 接口 进行 的 自动 连接 。 自 动 连接 时 可 以 选择 相 
应 的 接口 ,这 适用 于 简单 的 连接 。 当 遇 到 复杂 的 设计 时 ,如 多 个 时 钟 输入 ,为 了 确保 设计 的 
正确 性 ,可 能 需要 进行 手动 连 线 并 检查 连接 的 正确 性 。 

在 图 4-35 中 ,GPIO 模块 上 有 一 个 AXI Slave 接口 。 如 果 要 将 PS 与 AXI GPIO 模块 相 
连接 ,需要 在 PS 端的 GP 口 配置 一 个 AXI Master 接口 。 在 图 4-34 中 , ZYNQ7 Processing 
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图 4-35 增加 GPIO 模块 


System IP 核 已 经 默认 配置 了 一 个 AXI Master 接口 (M_AXI_GP0) ,因此 这 里 无 须 重 复 配置 。 

如 需 配 置 其 他 参数 ,可 双击 图 3-34 中 的 ZYNQ7 Processing System IP 核 , 即 打开 图 4-36 
所 示 界 面 。 在 此 可 以 进行 PS-PL 的 连接 方式 配置 (其 中 包含 常用 的 GP、HP 口 等 ) .物理 LI/ 
O 引 脚 配置 MIO 配置 .时 钟 配 置 .SMC 时 钟 计算 、 中 断 配置 等 。 

选择 图 4-36 左 侧 的 PS-PL Configuration 可 进行 PS-PL 连接 方式 的 配置 ( 见 图 4-37)， 
M. AXI GPO interface 被 勾 选 , 说 明 当前 PS 和 PL 之 间 可 通过 M_AXI_GP0 进行 连接 。 
图 4-35 中 也 对 应 显示 了 ZYNQ7 Processing System 模块 的 M_AXI_GP0 通道 是 可 用 的 。 
未 被 色 选 的 通道 在 图 4-35 中 就 没有 对 应 显示 。 

选择 图 4-36 左 侧 的 Clock Configuration 可 进行 时 钟 设置 。 如 图 4-38 中 ,通过 勾 选 设 
置 FCLK_CLK0 为 PL 中 的 功能 模块 所 使 用 的 时 钟 , 相 应 地 在 图 4-35 中 就 会 显示 ZYNQ7 
Processing System 模块 有 FCLK_CLKo 的 时 钟 输出 。 此 处 可 以 设置 时 钟 源 及 频率 ,如 
PLL/100MHz. 

选择 Run Connection Automation , 右 击 , 弹 出 如 图 4-39 所 示 对 话 框 。 将 GPIO 模块 中 
S AXI 的 三 个 时 钟 接口 都 连接 到 FCLK_ CLK0 上 。 由 于 之 前 配置 了 Pynq-Z2 的 
Boardfiles,AXI GPIO 模块 的 GPIO 引 脚 除了 可 连接 用 户 模块 ,也 可 连接 PYNQ 板 卡 的 任 
何 GPIO 资源 。 例 如 ,这 里 选择 Leds 4bits,GPIO 会 自动 配置 为 4 位 的 输出 。 然 后 单 击 OK 
按钮 ,进行 自动 连接 。 
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图 4-36 ZYNQ7 Processing System 配置 界面 
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图 4-37 PSPL 连接 方式 配置 
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图 4-39 Run Connection Automation 配置 
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自动 连接 后 可 右 击 ,选择 Regenerate Layout 对 Block Design 进行 自动 布局 ,布局 完成 
后 显示 如 图 4-40 所 示 的 连接 关系 。 


Diagram x AddressEditor x| 


图 4-40 PS 与 PL 的 连接 关系 


从 图 4-40 可 知 ,Run Connection Automation 还 会 自动 加 载 连接 到 所 需 的 其 他 必要 的 
模块 ,如 Processor System Reset, AXI Interconnect 模块 。 

AXI GPIO 模块 的 S_AXI 端口 与 PS 连接 ,而 其 GPIO 引 脚 可 以 与 PL 端的 用 户 模块 连 
接 。 运 行 在 PS 上 的 Python 代码 就 可 以 通过 控制 GPIO 引 脚 完 成 与 用 户 硬件 模块 的 交互 。 
另外 ,GPIO 引 脚 也 可 以 直接 连接 到 板 卡 上 的 外 设 , 运 行 在 PS 上 的 Python 代码 就 可 以 通过 
控制 GPIO 引 脚 完成 板 卡 上 外 设 的 控制 和 交互 。 


4.6 实现 


实现 主要 是 完成 转换 ,映射 ,布局 布线 和 最 终 比 特 流 的 生成 。 意 思 是 将 综合 生成 的 网 表 
一 步 步 地 与 特定 的 FPGA 芯片 关联 起 来 ,转换 成 该 FPGA 芯片 上 特有 的 资源 并 进行 映射 。 
实现 后 的 时 钟 才 是 与 具体 期 间 匹 配 之 后 得 到 的 更 准确 的 时 钟 。 

选择 Flow Navigator 中 的 IMPLEMENTATION >Run Implementation 可 进行 布局 
布线 等 实现 过 程 。 可 从 Reports 中 查看 Opt Design, Place Design, Route Design 等 报告 。 
当然 对 于 计算 机 组 成 原理 实验 来 说 ,实现 这 一 步骤 通常 是 由 Vivado 自动 完成 ,许多 内 部 的 
细节 并 不 需要 深究 ,除非 在 此 过 程 中 发 生 错误 时 需要 根据 提示 进行 相应 处 理 。 

Flow Navigator 中 的 IMPLEMENTATION-*Open Implementation Design 可 查看 实 
现 之 后 的 报告 。 

想 要 将 设计 加 载 到 FPGA 片上 ,需要 生成 比特 流 文 件 。 生 成 比特 流 文件 很 简单 ,只 需 
要 选择 Flow Navigator 中 的 PROGRAM AND DEBUG>Generate Bitstream 便 可 生成 。 

在 基于 PYNQ 的 组 成 原理 实验 中 ,通常 采用 Python 代码 的 方式 加 载 并 运行 比特 流 文 
件 , 因 此 ,这 里 就 不 再 介绍 比特 流 文件 的 下 载 过 程 。 在 后 续 章 节 的 Python 代码 示例 中 会 介 
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绍 如 何 加 载 生成 的 比特 流 并 运行 。 
4.7 TCL 使 用 介绍 


TCL(Tool Command Language) 是 一 种 由 John Ousterhout 创建 的 脚本 语言 ,最 早 称 
为 “工具 命令 语言 "。TCL 易学 易 用 且 功 能 强大 ,经 常 被 用 于 快速 原型 开发 .脚本 编程 .GUI 
和 测试 等 方面 。 

在 Vivado 中 也 提供 了 TCL 命令 。 利 用 TCL 提供 的 标准 语法 ,用 户 可 直接 发 送 指令 到 
Vivado 中 。 可 利用 TCL 创建 ,打开 ,保存 工程 , 找 某 个 时 钟 的 BUFG 或 者 综合 后 网 表 中 的 
某 一 个 信号 ,自动 触发 ILA 抓 取信 号 等 。 

为 了 使 用 PYNQ 中 Overlay 的 方式 与 PL 进行 交互 ,需要 了 解 更 多 Block Design 的 信 
息 , 所 以 需要 生成 有 关 Block Design 信息 的 TCL 文件 。 

如 图 4-41 所 示 ,打开 Block Design 页 面 ,选择 File— Export-- Export Block Design 生 
成 . tcl 文件 。 


Edit Flow Tools Repons Window Layout View Help Qr Quick Access 


Project [B PP "noz x Zx 
Add Sources. ^n^ EKDESIGN- design 1 
Close Project 


IPCatalog x ProjectSumn4 » = ? © Ci Diagram x Address Editor x| 


ave Block C 


Cores | inter sp | - 
Save Block Design As. Micha Qa xoqQz 
- : » 
Close Block Design Z e n +y om 


wstraint 
~ 所 Vivado Repository 
PEN > & Alliance Partners 


Checkpoint » | > = Audio Connectivity & Processing 


P n > 5 Automotive & Industrial 
> © AX Infrastructure. 
Text Editor. , 
> © AXIS Infrastructure E 
port ^ [c— > 


Export , Export Hardware. | 
Launch SDK Export Block Design.. 


lepository to see 


Brint Cirip 


Ext 
P Run Synthesis TclConsole | Messages |Log Reports x Design Runs 


Qizi$ t4 -!2|» 


> Open Synthesized Design 


~ IMPLEMENTATION. 


图 4-41 生成 tcl 文件 


.tcl 文件 还 可 用 于 还 原 整 个 工程 .避免 重复 工作 。 可 选择 Tool Run Tcl Script. 如 
图 4-42 所 示 。 

由 于 在 后 续 章 节 的 实验 中 经 常会 用 到 部 分 相同 的 原理 图 设计 ,如 果 每 次 实验 时 都 要 添 
加 各 个 模块 并 进行 模块 间 连 接 是 没有 必要 的 。 为 了 避免 大 量 重复 的 工作 ,可 以 将 这 部 分 原理 
图 设计 连接 完成 并 将 其 生成 一 个 tcl 文件 。 当 下 一 次 使 用 时 可 以 直接 通过 Vivado 软件 的 tcl 
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Ele Edit Flow Tools Repors Window Layout View Help  Q- QuickAccess 


mo Wo o [qu vaidateDesion 


Flow Navigator Create and Package New P. 


Create Interface Definition. 


Run Simulation 
Enable Partial Reconfiguration.. 
Run Td Script 


Property Editor Cl 9 
Associate ELE Files. | 


Generate Memory Configuration File. 


> RTLANALYSIS 


* SYNTHESIS 


b Run Synthesis 


Compile Simulation Libraries. 
SSiN 
Xilinx Tcl Store. | inl 
~ IMPLEMENTATION 


Custom Commands » 


> Run Implementatio 
Q Language Templates 


Y Open Implemented 
9 g Q9 Settings. 


图 4-42 运行 tcl 文件 


console 面板 打开 相关 的 tcl 文件 后 将 之 前 连接 好 的 部 分 原理 图 设计 调用 出 来 ,避免 了 重复 操 
作 。tcl console 界面 如 图 4-43 所 示 ,通过 在 方 框 处 输入 打开 tcl 的 语句 ,来 实现 原理 图 的 调用 。 


Design Runs 


aeS) 


| erente_bd_cell: Time (s): cpu = 00:00:04 ; elapsed = 00:00:05 . Memory (NB): peak = 890.992 ; gain = 54.543 
Q: /FPGM book/project, 1/project, 1. sres/sources_1/bà/design_1/design_1. bà) 
Q: /FPGM/ book/project, 1/project, 1. srcs/sources, 1/bà/design 1/ui/bd 1fSdefdD. ui? 


| update compile order -fileset sources | 


z 


ype a Icl command here 


图 4-43 tel console 界面 


通过 source 命令 打开 tcl 文件 ,输入 cel 文件 路 径 调用 原理 图 ,如 图 4-44 所 示 。 


* 
#) else{ 

* $ USE CASES 

# # 8) Jo opened design, design name not in project. 

* #9) Current opened design, has components, but diff names, design name not in project. 
P 


< 


source d:/6203/«203/ decode/ EFIFIB/ Bi inter face. tell 


图 4-44 原理 图 调用 语句 


4.8 实例 演示 


接 下 来 再 通过 一 个 简单 的 例子 (S 二 AB) 来 展示 上 述 的 完整 Vivado 开发 流程 ,上 传 比 特 
流 到 PYNQ 上 并 进行 Python 交互 的 部 分 将 会 在 第 5 章 介绍 。 
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4.8.1 原理 图 方式 


原理 图 方式 包括 创建 工程 .设计 输入 、 仿 真 . 与 PS 的 连接 .综合 .实现 .生成 比特 流 等 。 

1. 创建 工程 

参照 4. 1 节 在 boards 列表 中 选择 PYNQ_Z2 ,完成 工程 (project_1) 的 创建 。 

2. 设计 输入 

单 击 project 1 界面 左 侧 的 IP INTEGRATOR 下 的 Creat Block Design, 进 入 原理 图 设 
计 界 面 , 如 图 4-45 所 示 。 


Elle Edit Tm Tools Reports Window Layout View Help | Qv Quick Access 

Glia- 8b xmMHbunntÉsx »x 

LITENEXEM < 

PROJECT MANAGER. 
X Settings 


Sources | Design x Signals | Board 7-nn 
Q zi 2? 
i design 1 


Add Sources. 
Language Templates 


$ iP Catalog 


~ IPINTEGRATOR 
Create Block Design 
Open Block Design 


Generate Block Design 


Y SIMULATION 


Run Simulation 
Properties ? -00x 


Y RTLANALYSIS 各 | 中 | 次 


> Open Elaborated Design 


Y SYNTHESIS 
P Run Synthesis 
Select an objectto see properties 
> Open Synthesized Design 


Y IMPLEMENTATION 
P Run Implementation 
> Open implemented Design Tcl Console x Messages |Log Reports | Design Runs 

a 分 咱 目 时 瘟 

Cj INFO: [IP Flo» 19-2313] Loaded Vivado IP repository 'E:/Iil| 


V5 Generate Bitstream | set property bosrd part tul. con. tw:pynq-z2:partO:1.0 [curre 
(J create bd design "design 1" 


Y PROGRAM AND DEBUG 


? Open Hardware Manager 


| Wrote : QE /project/project, l/project. 1. srcs/scurces 1/bà/ 
Cj create bd design: Time (s): cpu = 00:00:09 ; elapsed = 00:0 


| update compile crder -fileset sources | 


I Iel command here 


图 4-45 原理 图 设计 
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可 以 添加 自 带 的 IP 或 用 户 手动 生成 的 IP 来 完成 设计 ,用 户 可 手动 生成 两 个 简单 的 IP， 
AND 和 NOT。 首先 再 重新 创建 一 个 工程 (project 2) , 右 击 , 选 择 Design Source 选择 Add 
Sources, 再 选择 Create File, 分 别 创建 名 为 AND.v 和 NOT.v 的 Verilog HDL 源 文件 。 


AND. v 代码 如 下 : NOT. v 代码 如 下 : 
module AND( module NOT( 

input A, input A, 

input B, output S 

output S ); 2 
assignS - A& B; assignS = ~A; 
endmodule endmodule 


在 project_2\project_2. sres\sources_1\new 下 创建 两 个 文件 夹 IP. AND 和 IP. NOT 
( 见 图 4-46) ,再 将 AND. v 和 NOT. v 分 别 复制 到 IP_AND M IP. NOT 中 去 。 


Jb v WAN o BAR (F) » project » projet? » projet2sres p sources » new » ao CI] 
dio nanea- RE- MRO FeR -00 
prem E i ssam - ES 

di 2345706 [À ANO. 2019/4/9 i925 NRR ] 
B Tw d» Nor 2014/91925 — XX 

mam Danow 200491916 V ix 
nm DM aosa 1915 Vae 1 


图 4-46 文件 夹 创建 


在 工程 主 界面 将 AND. v 设置 为 项 层 文件 , 单 击 Tools, 选 择 Create and Package New 
IP, 在 Packaging Options 中 选择 Package a specified directory ,出 现 如 图 4-47 所 示 文 件 夹 。 


Create and Pack p -—— — sso 
F and Package New 


Create Peripheral, Package IP or Package a Block Design 
Please select one of the following tasks. $ 


Packaging Options 
© Package your current project 
Use the project as the source for creating a new IP Definition. 
Package a block design from the current project 
Choose a block design as the source for creating a new IP Definition. 
(p |Packageaspecfieddredoy — — | 
Choose a directory.as the source for creating a new IP Definition 


| Create AXI4 peripheral 
© Create a new AXI4 peripheral. 
Create an AXI4 IP, driver, software test application, IP Integrator AXI4 VIP simulation and debug demonstration design. 
| © <Back Next | Einish Cancel 
a 


图 4-47 打包 一 个 文件 夹 
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在 IP 生成 地 址 中 选择 刚才 创建 的 IP_AND 文件 夹 ( 见 图 4-48) ,打包 成 IP 核 。 


f Create and Package New 1P UN .09099999 
9 00 
Package a Specified Directory 
Selectthe directory where sources to be packaged are located. a 


Directory: |F-Iprojeciproject 2/project 2.srcsisources. t/newIP. AND| ell -- 


图 4-48 打包 成 IP 


同 理 ,将 NOT. v 设置 为 顶层 文件 后 ,在 IP. NOT 文件 夹 中 生成 NOT.v 的 IP。 
在 project. 1 的 Project Settings 中 单 击 IP Repository 添加 IP 的 存放 路 径 ( 见 图 4-49)， 
单 击 Apply 按钮 ,将 IP 包 添加 到 工程 中 。 


œ 


IP > Repository 


Project Settings 
General 
Simulation 
Elaboration 
Synthesis 
Implementation 
Bitstream 

{vP 


Add directories to the list of repositories. You may then add additional IP to a selected 
repository. If an IP is disabled then a tool-tip will alert you to the reason. 


IP Repositories. 

+ -t+ 

fprojectiproject_2/project_2 srcs/sources_ newhP_AND (Project) 
‘Hprojectiproject_2/project_2 srcs/sources_1/newhP_NOT (Project) 


Repository 
Packager 
| Refresh Al 


Tool Settings 
Project 

| IP Defaults 

Source File. 


Display 
WebTalk 
Help 

| > Text Editor 

3rd Party Simulators 
> Colors 

Selection Rules. 
|l Shortcuts 
| > Strategies 
> Window Behavior 


I 
© OK 
M 


Cancel Apply Restore.. 


图 4-49 添加 到 资源 库 


在 project 1 的 Block Design 中 添加 这 两 个 IP。 参 照 3. 2. 1 节 完 成 引 脚 引出 和 HDL 
封装 ,如 图 4-50 所 示 。 

3. 仿真 

对 于 HDL 封装 形成 的 HDL wrapper 可 以 进行 仿真 。 在 project. 1 主 界面 右 击 , 选 择 
Simulation Source. 选择 Add Source ( 见 图 4-51). 然 后 选择 Add or create simulation 
sources, 再 选择 Create File, 最 后 给 Testbench 命名 ,如 图 4-52 所 示 。 
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Orr en 
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CT tou 
azeene o EEC e 
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PROJECT MANAGER 
€ Settings 
Add Sources 
Language Templates 


$ iP Catalog 


IP INTEGRATOR 
Create Block Design 
Open Block Design. 


Generate Block Design. 


SIMULATION 


Run Simulation 


RTL ANALYSIS. 


? OpenElaborated Design 


SYNTHESIS 
P Run Synthesis 


> Open Synthesized Design. 


IMPLEMENTATION 
P Run Implementation 


> Open Implemented Design 


PROGRAM AND DEBUG 
V Generate Bitstream 


图 4-50 原理 图 界面 


Ele Edt Flow Tools Repors Window Layout View Help Q- OuicAccess 


lH *^ 8 Ex eB», "n G z x ZN 


Sources x Design 


Q 三 sd+Den E 
v 3 Design Sources (1 
design 1 wrapper (design ! wrapperv)(t 
J& design 1 i. design 1 (design 15d) (2) 
design 1 AND ( 
QW design. 1. NOT 


Signals | Board 


) 1 (design 1 AND 0 xc) 
) 0 (design. 1. NOT. 0 xci) 


Hierarchy Update 
Refresh Hierarchy 
IP Hierarchy 


Edit Constraints Sets. 


Source File. x 
Edit Simulation Sets. 
@ design LÀ 
十 Addsources_ T 
YI Enabled 
Report IP Status. 
Location: iM 
Type: Verilog 
Library: xil. defaultiib. 


General 


Properties 
TelConsole x Messages |Log |Reports | Design Runs 
Qzsemute ums 


C) epen bà design (F:/project/project l/project 1. sres/seurces 1/bà/ 
| Adding cell — xilizx. com:uzer:AND:1.0 - ABD O 


图 4-51 


创建 Testbench 
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Testbench 示例 代码 如 下 : 


module test( ); 

reg À; 

reg B; 

wire S; 

design 1 wrapper ul( 
.A 0(A), 
.B 0(B), 
.S 0(S) 

initial 

begin 
#20 
A=1'b1; 
B= 1'b0; 
#20 
A-1'b0; 
B= 1'b0; 
#20 
A-1'b0; 
B- 1'b1; 
#20 
A=1'b1; 
B=1'b1; 

end 

endmodule 


$^ Create Source File [7x7] 

Create a new source file and add itto your 
project s 

File type @ Verilog v 

Filename:  |test 

File location: | &: «Local to Project» v 

5 T A A 
图 4-52 Testbench 命名 


//'Testbench 模块 名 ,为 顶层 模块 , 且 没 有 输入 /输出 


// 例 化 design_1_wrapper 


// 延 昌 


// 延 昌 


// 延 时 


// 延 时 


20 个 时 间 单 位 


20 个 时 间 单 位 


20 个 时 间 单 位 


20 个 时 间 单 位 


Testbench 编写 完成 后 ,在 左 侧 工程 管理 栏 中 选择 Simulation Run Simulation run 
behavioral simulation 可 进行 行为 仿真 验证 ,结果 如 图 4-53 所 示 o 


Q M à à xc t 


46 «J| 计算 机 组 成 原理 在 线 实验 教程 一 FPGA 远 程 实验 平台 教学 与 


学 


/| 2 


践 


4. 与 PS 的 连接 
单 击 project 2 界面 左 侧 的 IP Integrator 下 的 Creat Block Design, 创 建 一 个 新 的 Block 


Design。 参 照 4. 5. 2 节 完 成 对 PS 端的 配置 ,不 同 的 是 这 里 需要 添加 两 个 AXI_GPIO 模块 ， 
如 图 4-54 所 示 。 删 除 两 个 GPIO 的 arduino_a0_a5 接口 。 


Diagram x MddressFdtor x| 


700 
&qazxxXoaz:zet^s^4B8xscsuysos 


图 4-54 原理 图 连接 


双击 axi_gpio_0 ,在 Board 中 将 Board Interface 设置 为 Custom, 如 图 4-55 所 示 。 在 IP 
Configuration 中 按 图 4-56 进行 设置 ,为 GPIO 设置 两 个 1 位 输出 端口 。 


4^ Re-customize IP 


AXI GPIO (2.0) 


(Documentation. 5s IP Location 


Show dasbied pots ComponentName axi gpio 0 
Board — IP Configuration. 
Associate IP interface with board interface 


IP Interface. Board Interface. 


Enable Interrupt 


图 4-55 配置 卫 核 1 
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AXI GPIO (2.0) 


( Documentation Cs IP Location 


C] Show disabled ports 


图 4-56 配置 IP 核 2 

双击 axi gpio 1.fE Board 中 将 Board Interface 设置 为 Custom。 在 IP Configuration 

中 按 图 4-57 进行 设置 ,为 GPIO 设置 一 个 1 位 输入 端口 。 
A pranca 


AXI GPIO (2.0) 


O Documentation S IP Location 


C] Show disabled ports 


Set this checkbox if only inputs are present 


An inputs 


AI Outputs 


图 4-57 配置 IP 核 3 
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此 时 Block Design 如 图 4-58 所 示 。 


Diagram x AddressEdior x| ?or 


QQ noQalzs+ "BCIH e 
P Designer Assistance available. Run Connecton Automation 


rst ps7 0 100M 


Processor System Reset 


AXI interconnect 


processing system? 0 


vasco jc ZYNG 


ZYNOT Processing System 


图 4-58 加 入 了 GPIO 后 的 最 终 连接 图 


添加 之 前 生成 好 的 AND vl 0 fl NOT. v1 0 两 个 IP, 并 与 两 个 GPIO 按 图 4-59 进行 
连接 ,完成 PS 和 PL 的 连接 。 


[| 


Q Qa XNOQHZG + 28-3 2] 


axi gpio 0 


NOT v1 0 


AND v1 0 


gpio io i00] 4 


AXI GPIO 


图 4-59 与 用 户 模块 连接 


5. 综合 

对 刚才 创建 的 design_1. bd 进行 HDL 封装 ,并 将 封装 后 的 design_1_wrapper 设置 为 
顶层 文件 。 单 击 project_2 主 界面 的 SYNTHESIS->~run synthesis, 会 出 现 Lauch Runs 3f 
出 窗口 , 单 击 OK 按钮 进行 综合 。 

6. 实现 

当 综 合 完成 时 会 出 现 Synthesis Completed 弹出 窗口 ,选择 Run Implement 进行 实现 。 


7. 生成 比特 流 
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当 实 现 完成 时 会 出 现 Implement Completed 弹出 窗口 ,选择 Generate Bitstream 来 生 


成 比特 流 。 


选择 Files > Export— Export Block Design. 如 图 4-60 所 示 , 选择 存放 路 径 , 导出 


design 1. tcl, 如 图 4-61 所 示 。 


2/project_2xpr] -Vivado 20182 > 
四 as mem View Heip | Qr QuickAccess 
Project Saat 
Add Sources... DESIGN - design 1 
Close Project 
rces x Design | Signals | Board ?- 0G] | Dagan 
: a žė + e» 立 | | @ 
Save Block Design As. 
lé. Design Sources (5) 
Close Block Design ^. design 1 wrapper (design 1 wrappers) (1) 
xem" @ AND (AND v) 
6 NoT NoT») 
| e aov 
Checkpoint , e wor») 
P » po Constraints 
ei y D = Simulation Sources (5) 
Import » 
d g || Export Hardware. ares Compile Order 
Launch SDK Epal Bleck Dasig. 
Print. Ctri«P p " 人 
Export Simulation. e-+- 9% 
Z Enabled a 


图 4-60 导出 TCL 


Generate and export Tcl scriptthat can be used to recreate this block design. 


s 


Idfile: |Fprojectiproject 2/design 1.tcl ell - 


Z) Automatically create top design 


Cancel 


导出 TCL 


图 4-61 


在 project 2/project 2. runs/impl 1 目录 下 找到 design 1 wrapper. bit ,并 将 其 复制 到 
project 2 目录 下 ,使 其 和 design_l. tcl 在 同一 目录 下 。 再 将 design_1_wrapper. bit 重 命名 
23 design 1. bit, 使 其 和 .tcl 文件 同名 ,如 图 4-62 所 示 。 


4.8.2 Verilog 方式 
Verilog 方式 包括 创建 工程 .设计 输入 、 仿 真 . 与 PS 连接 综合、 实现 .生成 比特 流 等 。 
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7 nas ee d "asm =m 大 小 
Juss B prie 2nd manous XA 
B rw pps amsanonso zea 
mm lk proie 2i mec e amsinonso xea 
eg | zanose 。 
di project 2.sim 2019/4/10 11:50 ZES 
Owa B peau. 2019/4101150 SES 
4h project 2tmp. 2019/4/9 1953 E ed 
$ D desig Lt 2094001980 BR TS 
司库 L design. Ltcl. 2019/4/10 1505  TCLXW 45KB 
Bun À projet 2 2019/4/.01459 Vivado Project Fi. 26KB 
图 4-62 bit 流 文件 
1. 创建 工程 
参照 4. 1 WE boards 列表 中 选择 PYNQ_Z2 ,完成 工程 (project_3) 的 创建 。 
2. 设计 输入 


在 工程 创建 完成 之 后 , 右 击 ,选择 Design Source 选择 Add Sources 添加 或 创建 设计 文 
件 , 再 选择 Create File, 创 建 名 为 example. v 的 Verilog HDL 源 文件 。 


module example( 


3. 仿真 

在 主 界面 右 击 ,选择 Simulation Source. 选择 Add Source, 然 后 选择 Add or create 
simulation sources, 再 选择 Create File, 创 建 名 为 test. v 的 仿真 文件 。 

Testbench 示例 如 下 : 


module test( ) //Testbench 模块 名 ,为 顶层 模块 , 且 没 有 输入 /输出 
reg A; 
reg B; 
wire S; 
example ul( // 例 化 example. v 
.A O(A), 


#20 // 延 时 20 个 时 间 单 位 


#20 // 延 时 20 个 时 间 单 位 
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A-1'b0; 
B-1'b0; 
#20 // 延 时 20 个 时 间 单 位 
A-1'b0; 
B-1'bl; 
#20 // 延 时 20 个 时 间 单位 
A-1'bl; 
B-1'bl; 
end 
endmodule 


Testbench 编写 完成 后 ,在 左 侧 工程 管理 栏 中 选择 Simulation Run Simulation>run 
behavioral simulation 可 进行 行为 仿真 验证 ,仿真 结果 与 原理 图 方式 一 样 。 

4. 与 PS 连接 

单 击 Tools, 选 择 Create and Package New IP, 在 Packaging Options 中 选择 Package 
your current project, 将 example. v 打包 成 IP。 

单 击 工程 界面 左 侧 的 IP Integrator 下 的 Creat Block Design, 创建 一 个 新 的 Block 
Design, £N 4.5. 2 节 完 成 对 PS 端的 配置 ,不 同 的 是 需要 添加 两 个 AXI_GPIO 模块 ,如 
图 4-53 所 示 。 删 除 两 个 GPIO 的 arduino a0 a5 接口 。 

双击 axi_gpio_0, 在 Board 中 将 Board Interface 设置 为 custom, 如 图 4-54 所 示 。 在 IP 
Configuration 中 按 图 4-55 进行 设置 ,为 GPIO 设置 两 个 1 位 输出 端口 。 

双击 axi_gpio_1, 在 Board 中 将 Board Interface 设置 为 custom。 在 IP Configuration 
中 按 图 4-56 进行 设置 ,为 GPIO 设置 一 个 1 位 输入 端口 。 此 时 Block Design 如 图 4-57 
所 示 。 

添加 之 前 生成 的 example_v1_0 这 个 IP, 并 与 两 个 GPIO 按 图 4-63 进行 连接 ,完成 PS 
和 PL 的 连接 。 


x exampley x testy x Address Editor x 


5. 综合 

对 刚才 创建 的 design_1. bd 进行 HDL 封装 ,并 将 封装 后 的 design_1_wrapper 设置 为 
顶层 文件 。 单 击 project_3 主 界面 的 SYNTHESIS-~run synthesis, 出 现 Lauch Runs 弹出 
窗口 , 单 击 OK 按钮 进行 综合 。 
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6. 实现 


| 


台 教 学 与 实 


当 综 合 完成 时 会 出 现 Synthesis Completed 弹出 窗口 ,选择 run Implement 进行 实现 。 


7. 生成 比特 流 


当 实 现 完成 后 会 出 现 Implement Completed 弹出 窗口 ,选择 Generate Bitstream 来 生 


选择 Files Export Export Block Design, 出 现 如 图 4-64 所 示 界 面 , 再 选择 存放 路 径 ， 
导出 design_l.tcl, 如 图 4-65 所 示 。 


Projed 
Add Sources... 


E Close Project 


Save Block Design As. 


Close Block Design 


Elle Edit Flow Tools Repons Window Layout View Help Qr Quick Access. 
Bb»Hünors*sssmM 


DESIGN - design. 1 


rces x Design | Signals | Board ? nrm[| Diagram 


局 I 玉 | 和 | 十 | 口 
|^. Design Sources (3) 


> 


example (example v) 
» 3 IP-XACT (1) 
b & Constraints 


design. 1 wrapper (design 1 wrapper) (1) 


e» 办 | aa 


x example.v 


E 
P4 


[ 
x|testv x| 


Qc 


4 Checioolnl * pm Simulation Sources (2) 
P | 5 simio 
Text Editor , > 6. test test) (1 
> @ design 1 wrapper (design 1 wrapperv) (1) =f 
a M00 ARESETN 
VETERE 1_ACLK 
» Export Hardware. i 
Expor port Hi | Compile Order MOTARESETN 
" Launch SDK Export Block Design... 
Print. T Export Bitstream File. 7-UuB5x 
Export Simulation... 一 
Ext -* kd 
" ^ 
Z) Enabled 
> Open Elaborated Design 
Location FJprojectiproject 3iproject 3.srcs/sources. 4/l 
Y SYNTHESIS Type Veriog ^ [-—] 


图 4-64 


导出 TCL( 一 ) 


1 Export Block Desion ME BEL 


Generate and export Tcl script that can be used to recreate this block design. 


Idfile: |FJprojectiproject 3/design 1.tcl ell - 
j| 
l| Z Automatically create top design 
| 自动 @ 键 顶级 设计 
| EA c 
图 4-65 导出 TCLC—) 


在 project 3/project 3. runs/impl 1 目录 下 找到 design 1 wrapper. bit ,并 将 其 复制 到 
project 3 目录 下 ,使 其 和 design_1. tcl 在 同一 目录 下 ,再 将 design_1_wrapper. bit 重新 命名 
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为 design_1. bit, 使 其 和 . tcl 文件 同名 ,如 图 4-66 所 示 。 


2019/4/10 19:59 
2019/4/10 18:50 


2019/4110 1850 xe 
2019/4110 2005 ae 

2019/4/10 18.50 Re% 

2019/4110 1908 zez 

2019/4/10 2008 BIT 文人 
2019/4110 2012 。 TCL 文件 
2019/4/102007 Vivado Project Fi.. 


4-66 比特 流 文件 
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CHAPTER 5 


前 面 章 节 介绍 了 如 何 使 用 Vivado 设计 自己 的 硬件 模块 ,以 及 如 何 通过 AxiGPIO 将 自 
己 设 计 的 模块 与 PS 连接 起 来 。 本 章 主 要 介绍 基于 Jupyter Notebook ,通过 Python 代码 的 
方式 操作 AxiGPIO 与 用 户 设 计 的 硬件 模块 进行 交互 。 


5.1 Jupyter Notebook 介绍 


Jupyter Notebook 是 Fernando Perez 发 起 的 IPython 项 目 。IPython 是 一 种 交互 式 
shell, 与 普通 的 Python shell 相似 却 具 有 一 些 很 好 的 功能 ,如 语法 高 亮 显 示 和 代码 补 全 等 。 
Jupyter Notebook 的 工作 方式 是 通过 Web 浏览 器 打开 并 编辑 Python 源 代码 ,将 其 消息 发 
送 给 IPython 内 核 , 由 内 核 执行 代码 ,然后 将 结果 发 送 回 浏览 器 的 Notebook。IPython 内 核 
是 在 后 台 运 行 的 IPython 应 用 程序 ,本 书 介绍 的 IPython 内 核 是 运行 在 Zynq-7000 的 PS 
上 的 。 

Jupyter 的 核心 是 Notebook 服务 器 ,通过 浏览 器 连接 到 该 服务 器 。 而 Notebook 呈现 
为 Web 应 用 。 保 存 Notebook 时 , 它 将 作为 JSON 文件 (文件 扩展 名 为 . ipynb) 写 入 到 该 服 
务 器 中 。 

采用 Jupyter Notebook 架构 的 一 个 优点 是 : 内 核 无 须 运 行 Python。 由 于 Notebook 和 
内 核 相 互 独立 ,因此 可 以 在 两 者 之 间 发 送 任何 语言 的 代码 。 例 如 ,早期 的 两 个 非 Python 内 
核 分 别 是 R 语言 和 Julia 语言 。 使 用 R 内 核 时 .用 R 编写 的 代码 将 发 送 给 执行 该 代码 的 R 
内 核 , 这 与 在 Python 内 核 上 运行 Python 代码 完全 一 样 。IPython Notebook 如 今 已 被 更 名 
为 Jupyter Notebook, 因 为 Notebook 变 得 与 编程 语言 无 关 。 新 的 名 称 Jupyter 由 Julia、 
Python 和 R 组 合 而 成 。 

第 二 个 优点 是 可 以 在 任何 地 方 运行 Notebook 服务 器 .并 且 可 通过 互联 网 访问 服务 器 。 
通常 会 在 存储 所 有 数据 和 Notebook 文件 的 自 有 计算 机 上 运行 服务 器 。 但 是 ,也 可 以 在 远 
程 计算 机 或 云 实例 (如 本 书 介绍 的 PYNQ 云 节点 ) 上 设置 服务 器 。 之 后 ,就 可 以 在 世界 上 任 
何 地 方 通过 浏览 器 访问 Notebook, 

第 三 个 优点 是 由 于 它们 比 IDE 平台 更 具 交 互 性 ,因此 它们 被 广泛 地 应 用 于 教学 场景 。 


5.1.1 Jupyter 组 件 
Jupyter 组 件 的 内 容 : 
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COD Web 浏览 器 : 交互 式 Web 应 用 程序 ,用 于 交互 式 编写 和 运行 代码 以 及 编写 笔记 本 
文档 。 

(2) WE: 由 Notebook Web 应 用 程序 启动 的 独立 进程 , 它 以 给 定语 言 运行 用 户 代 码 并 
将 输出 返回 给 Notebook Web 应 用 程序 。 对 于 PYNQ 来 说 , 它 是 用 Python 编写 的 ,是 
Jupyter Notebook 的 默认 内 核 ,也 是 PYNQ 发 行 版 中 为 Jupyter Notebook 安装 的 唯一 
内 核 。 

(3) Notebook 文档 : 包含 Notebook Web 应 用 程序 中 所 有 内 容 表 示 的 自 包含 文档 。 


5.1.2 Notebook 基础 


Notebook 服务 器 在 PYNQ 上 PS ARM 处 理 器 上 运行 。 当 本 地 电脑 以 任何 方式 与 
PYNQ 开发 板 连接 时 ,使 用 任意 浏览 器 访问 pynq:9090 即 可 连接 到 Jupyter Notebook. 
图 5-1 为 Jupyter Notebook 界面 。 

(1) 要 创建 新 的 Notebook 文档 ,请 单 击 列表 顶部 的 New 按钮 ,然后 从 下 拉 列 表 中 选 
择 , 如 图 5-2 所 示 。 


二 Jupyter om 


Notebook 


Fies | Running Clusters 


Python 3 
Select items to perform actions on them. Upload New» © 
Gol-|- Namo | | Last Modified Other 
B O base 10AN Text File 
eo 1 人 月 前 
kii : Folder 
IB O getting started 1 个 月 前 1 
erminal 
(B O logictools. 1 个 月 前 


图 5-1 Jupyter Notebook 界面 图 5-2 新 建文 档 


(2) 列表 中 图 标 为 绿色 , 且 显 示 绿 色 Running 文本 的 文件 是 正在 运行 的 文件 ,如 图 5-3 
所 示 。 直 到 明确 关闭 为 止 , 这 些 文件 会 一 直 运 行 。 


目 d unttedipynb 21 小 时 前 。 28.7KB 
G Æ Untitedtipynb. 9 天 前 8388 
G &@ United2ipynb 17 天 前 132kB 
目 Æ Unttied3ipynb 4— 一 一 > Running 6 分 钟 前 5558 


图 5-3 正在 运行 的 文件 


(3) 要 查看 所 有 正在 运行 的 文件 及 其 目录 ,可 以 选择 Running 选项 ,如 图 5-4 所 示 。 


Files Running Clusters 
Currently running Jupyter processes 
Terminals + 
There are no terminals running. 
Notebooks v 
Æ Untitied3.ipynb. Python 3 Juss 


图 5-4 查看 运行 文件 
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5.1.3 Notebook 用 户 界 面 


创建 文件 或 打开 现 有 文件 后 ,将 进入 Notebook 用 户 界 面 。Notebook 用 户 界 面具 有 以 
下 主要 区 域 ; 

(1) Notebook 的 名 称 。 

(2) 主 工具 栏 提供 了 保存 、 导 出 、 重 载 Notebook ,以 及 重启 内 核 等 选项 。 


(3) 快捷 键 。 
(4) Notebook 主要 区 域 ,包含 了 Notebook 的 内 容 编辑 区 ,界面 如 图 5-5 所 示 。 
TZ Jupyter Untitled3 Last Checkpoint: JUSS (unsaved changes] [ | bou 
File Edit View Insert Cell Kemel Widgets Help Kernel starting. please wait. Trusted. | Python 3 © 
[B] *|*|& I| ^| * | MRon WC P [cose *|[m 
| In i ]:| 
图 5-5 用 户 界面 
Jupyter Notebook 有 两 种 模式 : 编辑 模式 和 命令 模式 。 
1. 编辑 模式 


编辑 模式 由 绿色 单元 格 边框 指示 。 当 单元 格 处 于 编辑 模式 时 ,可 以 像 普通 文本 编辑 器 
一 样 输入 单元 格 。 按 Enter 键 或 单 击 单元 格 的 编辑 器 区 域 可 进入 编辑 模式 ,如 图 5-6 所 示 。 


In [ ]:|def study0): 
study*l 
print (study) 


图 5-6 编辑 模式 


2. 命令 模式 
命令 模式 由 带 有 蓝 色 左边 距 的 灰色 单元 格 边框 表示 ,如 图 5-7 Bron o 


In [1]: | def studyO : 
studysl 
print (study) 

study) 


1 


图 5-7 命令 模式 


Notebook 可 以 通过 修改 之 前 的 单元 格 , 对 其 重新 运算 ,同时 更 新 整个 文档 。 例 如 将 
图 5-7 中 的 print(study) 改 为 print("love"), 然 后 按 下 Shift 十 Enter 组 合 键 重新 计算 该 单元 


格 ,输出 结果 马上 就 更 新 成 了 "love"。 通 过 这 种 方法 可 以 对 某 

模块 进行 多 次 修改 ,可 大 大 减少 程序 开发 与 调试 的 时 间 。 
Notebook 中 还 有 Header 单元 格 和 Markdown 单元 格 两 种 Markdown 

不 同 的 单元 格 , 可 以 利用 它们 对 代码 进行 美化 ,如 图 5-8 所 示 。 iod 


Heading 可 以 创建 不 同 层级 的 标题 ,并 将 之 与 代码 相 区 分 ， 
图 5-8 其 他 单元 格 类 型 
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使 得 代码 的 层次 更 加 清晰 。Markdown 可 以 对 解释 文本 进行 漂亮 的 泻 染 , 产 生 美观 的 注释 ， 
效果 如 图 5-9 所 示 。 


My first title in Jupyter 


A very simple operation 
Lefs add two numbers: 
In [1]: 1*2 
Out[1]: 3 
Counter 
Let's count trom 0 to 4: 


In [2]: for i in range(5): 
print(i) 


sunno 


In): 


图 5-9 Heading 和 Markdown 使 用 效果 


5.2 使 用 PYNQ Overlay 加 载 流 文件 


用 户 设 计 的 比特 流 文件 可 以 通过 Vivado 工具 下 载 到 PL 中 ,也 可 以 在 Jupyter 
Notebook 中 直接 使 用 Python 代码 进行 下 载 。PYNQ 中 已 经 
内 置 了 Jupyter Notebook, [e 2 

首先 将 Vivado 中 生成 的 *. bit 和 *. tel 这 两 个 文件 通过 Namew | LastModiied 
Jupyter Notebook 导入 到 PYNQ 板 卡 上 。 如 图 5-10 所 示 ,在 siad 
Jupyter Notebook 中 单 击 Upload ,选择 文件 路 径 将 上 述 两 个 文 图 5-10 上 传 文件 
件 加 载 进 Jupyter Notebook 可 访问 的 文件 夹 中 。 

在 使 用 Python 代码 下 载 比特 流 文件 时 ,首先 要 引入 PYNQ 包 中 的 Overlay 文件 ,然后 
通过 Overlay 来 加 载 比特 流 到 PYNQ 中 。 如 示例 中 将 base. bit 流 文件 加 载 到 PYNQ 板 卡 
上 的 FPGA 芯片 中 去 。 想 要 配置 自己 的 比特 流 文件 ,只 需要 生成 命名 相同 的 *. bit 与 *.tcl 
文件 。 例 如 : 


from pynq import Overlay 
overlay- Overlay("base. bit") 井 加 载 流 文件 "base.bit"。Tcl 文件 也 是 需要 的 ,会 进行 解析 


5.3 Python 引 脚 绑 定 


AxiGPIO 接口 模块 提供 了 从 外 部 通用 外 设 ( 如 led, 按钮 .通过 AxiGPIO 控制 器 IP 连 
接 到 PL 的 开关 ) 读 取 、 写 入 和 接收 中 断 的 方法 。AxiGPIO 模块 控制 PL 中 AxiGPIO 控制 


58 «J| 计算 机 组 成 原理 在 线 实验 教程 一 FPGA 远 程 实验 平台 教学 与 实践 


器 的 实例 。AxiGPIO 框图 如 图 5-11 所 示 , 每 个 AxiGPIO 最 多 有 两 个 通道 ,每 个 通道 位 宽 
最 大 为 32 位 。 

通过 Python 调用 read() 和 write() 用 于 在 通道 上 读 
写 数 据 。 

setdirection() 和 setlength() 可 用 于 配置 IP。 

AxiGPIO 的 方向 可 以 是 in、out 和 inout; AxiGPIO 
默认 的 方向 是 inout, ET in 或 out 后 只 允许 对 IP 分 
别 进行 读 和 写 操作 ,如 果 读 取 'out ' 或 写 入 'in' 将 会 报错 。 A 

官方 文档 中 包含 的 例子 介绍 了 如 何 使 用 AxiGPIO 模块 。 在 实践 中 ,可 以 使 用 LED、 
按钮 .开关 和 RGBLED 等 来 扩展 AxiGPIO, 这 些 外 围 设备 需要 使 用 Overlay 来 加 载 bit X 
件 。 在 加 载 Overlay 之 后 ,通过 将 AxiGPIO 控制 器 的 名 称 传递 给 实例 化 的 AxiGPIO 
实例 。 

加 载 bit 文件 和 端口 分 配 的 示例 如 下 : 


axi gpio 0 


AXI GPIO 


from pynq import Overlay 

from pynq.lib import AxiGPIO 

ol = Overlay("base.bit") 

led ip - ol.ip dict['gpio leds'] 
switches ip - ol.ip dict['gpio switches'] 
leds = AxiGPIO(led ip).channell 

switches - AxiGPIO(switches ip).channell 


首先 将 bit 文件 通过 Overlay 函数 赋值 给 变量 ol ,再 通过 led ip = ol.ip dict[ 'gpio - 
leds'] 将 采用 Vivado 设计 时 命名 为 "gpio_leds' 的 AxiGPIO 模块 赋值 到 Jupyter Notebook 
中 的 led ip 端口 ,完成 Jupyter 与 AxiGPIO 的 连接 。 使 用 leds = AxiGPIO (led_ip). 
channell 语句 对 AxiGPIO 的 通道 1 进行 定义 。 

简单 的 读 写 操作 的 示例 如 下 : 


mask = OxfFFFFFFF 
leds.write(0xf, mask) 
Switches.read() 


AxiGPIO 需要 包含 掩 码 进 行 写 操作 。 首 先 定 义 一 组 掩 码 值 ,再 对 定义 完成 的 端口 通过 
write() 和 read() 进 行 数据 的 读 写 操作 。 


5.4 基于 Python 调试 组 合 逻 辑 


通过 Python 调试 组 合 逻 辑 方法 相对 比较 简单 ,本 书 涉 及 的 组 合 逻 辑 实 验 基 本 都 使 用 
相同 的 调试 文件 。 文 件 主要 使 用 read() 和 write() 两 个 模块 。 下 面 的 例子 来 自 第 8 章 加 法 
器 实验 的 Python 程序 。 

编辑 Python 代码 时 需要 调用 很 多 的 库 函 数 , 在 PYNQ 平台 上 内 置 了 很 多 的 库 函 数 ,使 
用 时 可 以 直接 调用 。 
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from pynq import Overlay # iH Overlay HE 

from pynq.lib import AxiGPIO 井 调 用 AxicPIO HE 

overlay = Overlay("/home/xilinx/jupyter notebooks/--.bit") 井 b 让 文件 路 径 

overlay? 井 显示 出 bit 文件 中 的 各 种 IP 信息 

对 各 个 端口 进行 命名 : 

gpio 0 = overlay.ip dict['axi gpio 0'] “ 井 将 使 用 的 AxiGPIO 模块 Jupyter Notebook 中 进行 命名 


gpio 1 = overlay.ip dict['axi gpio 1'] 


gpio 2 overlay. ip dict['axi gpio 2'] 


a = AxiGPIO(gpio 0).channell # Xf AxiGPIO 上 的 各 个 通道 进行 命名 
b = AxiGPIO(gpio 0).channel2 

cin = AxiGPIO(gpio 1).channell 

s = AxiGPIO(gpio 1).channel2 

cout = AxiGPIO(gpio 2).channell 


对 AxiGPIO 的 输出 端口 使 用 write() 进 行 赋值 ,将 数据 送 到 PL 端 进行 处 理 。 待 PL 端 
处 理 结 束 后 将 结果 送 回 AxiGPIO 的 输入 端 ,并 通过 read() 读 取出 处 理 后 的 结果 。 通 过 
AxiGPIO 输出 数据 时 需要 掩 码 才 能 输出 ,一般 默认 掩 码 每 个 位 都 为 1。Python 中 4 位 十 六 
进 制 的 扼 码 为 0xf, 用 户 可 以 根据 输出 数据 的 位 数 改 变 掩 码 的 位 数 。 如 第 4 章 介 绍 ,Channel 
的 位 宽 是 用 户 在 Vivado 中 调用 AxiGPIO 时 设置 好 的 。 


mask = Oxf # AxiGPIO 掩 码 

a.write(8,mask) # Hf AxiGPIO 的 输出 端口 赋值 为 8 
b. write(9, mask) 

cin. write(0, mask) 


GPIO 接收 端 得 到 数据 后 不 会 显示 出 来 ,此 时 需要 使 用 print O 函数 来 显示 得 到 的 
结果 。 


print(cout. read()) 井 将 AxiGPIO 接收 端 得 到 的 结果 显示 出 来 
print(s.read()) 


5.5 基于 Python 调试 时 序 逻 辑 


时 序 逻 辑 电路 通过 Python 进行 交互 的 时 候 , 由 于 PL 端 并 行 度 高 ,数据 处 理 速度 快 ,而 
PYNQ 平台 上 的 AxiGPIO 模块 有 延 时 。 当 数据 处 理 量 较 大 时 ,有 了 时 会 造成 AxiGPIO 读 取 
时 序 电 路 数据 时 出 现 数 据 遗 漏 ,造成 数据 不 完整 。 为 了 解决 这 一 问题 ,将 时 序 电 路 的 时 钟 输 
入 端口 通过 Python 调试 文件 进行 输出 ,保证 Python 调试 程序 的 时 钟 与 PL 端 相 一 致 。 让 
每 个 时 钟 周期 的 数据 都 能 被 记录 下 来 。 下 面 使 用 包含 时 序 电 路 的 计数 器 Python 调试 模块 
进行 介绍 。 

读 取 比特 文件 和 对 各 端口 进行 命名 这 两 部 分 与 逻辑 电路 时 基本 相同 ,在 此 不 再 袭 述 。 
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from pynq import Overlay 
from pynq.lib import AxiGPIO 
overlay = Overlay("/home/xilinx/jupyter notebooks/.-- bit") 


overlay? 


gpio 0 = overlay.ip dict['axi gpio 0'] 
gpio 1 = overlay.ip dict['axi gpio 1'] 
gpio 2 = overlay.ip dict['axi gpio 2'] 


clk = AxiGPIO(gpio 0).channeli 井 对 时 钟 所 在 通道 进行 命名 
rst n = AxiGPIO(gpio 0).channel2 井 对 复位 所 在 通道 进行 命名 
out0 = AxiGPIO(gpio 1).channell 


在 时 序 逻 辑 中 引入 时 间 函 数 来 进行 延 时 ,保证 数据 有 足够 的 时 间 写 入 读 出 ,防止 出 现 错 
误 。 复 位 端口 低 电 平 有 效 ,不 复位 时 该 端口 要 置 1 。 


import time 井 调用 时 间 函 数 
mask = 0bl # AxiGPIO 掩 码 
timedelay = 0.1 井 设置 时 间 延 时 
rst_n. write(0b0, mask) 井 进 行 复位 


rst_n. write(0b1, mask) 


时 钟 的 变化 为 高 低 电 平 交 替 , 可 通过 Python 调试 文件 设置 时 钟 的 变换 ,并 通过 For 循 
环 来 模仿 时 钟 连续 性 。 

Python 中 for 循环 包含 三 个 变量 ,第 一 位 为 循环 的 起 始 位 ,第 二 位 为 循环 的 次 数 ,第 三 
位 为 循环 步 长 。 当 步 长 为 1 时 每 循环 一 次 循环 次 数 加 1, 如 果 步 长 为 N , 则 每 次 循环 后 循环 
次 数 加 N 。 

由 于 每 个 时 钟 周期 后 的 数值 都 需要 被 记录 ,直接 输出 结果 观察 起 来 会 很 不 方便 ,通过 使 
用 数组 可 以 保证 每 个 时 钟 的 结果 都 单独 保存 。 每 次 循环 中 都 建立 一 个 空白 的 数组 ,并 通过 
append 函数 将 数值 添加 到 数组 中 保存 起 来 。 


import time 

N= 30 

timedelay = 0.1 

sizes = range(0,N,1) # 设 置 循 环 次 数 
mask = 0b1 

for size in sizes: 

clk. write( 0b0, mask) # 创 造 时 钟 

clk. write(0bl,mask) 

tmp-[] # 创 建 数组 保存 结果 
al = out0.read() 

tmp. append(al) 

print(tmp) # 打 印 数据 , 读 出 每 个 时 钟 中 周期 的 结果 
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5.6 实例 演示 


在 参照 4.8 节 生 成 . bit 和 . tcl 文件 后 ,请 查看 第 2 章 完成 PYNQ 实验 环境 的 准备 ,之 后 
按照 以 下 步骤 完成 基于 PYNQ 的 Python 调试 。 


5.6.1 上 传 .bit 和 .tcl 文件 


通过 选择 New Folder 新 建 一 个 文件 夹 ,选中 这 个 文件 夹 将 其 重 命名 为 Example。 
将 4.8 节 生 成 的 design_1. bit 和 design. 1. tcl. 上 传 到 Jupyter Notebook 新 建 的 
Example 文件 夹 下 ,如 图 5-12 所 示 。 


图 5-12 ”上传 相关 文件 


5.6.2 基于 Python 的 1/0 交互 


基于 Python 的 1/0 交互 过 程 如 下 : 
1. 创建 Notebook 
首先 通过 选择 New>Python 3 创建 一 个 Notebook, 如 图 5-13 所 示 。 


TS Jupyter Untitled Last Checkpoint 2 288. (unsaved changes) & os 


图 5-13 创建 Python 文件 


2. 使 用 pynq Overlay 加 载 比 特 流 
代码 如 下 : 


from pynq import Overlay 

from pynq.lib import AxiGPIO 

overlay = Overlay("/home/xilinx/jupyter notebooks/Example/design 1.bit") 
overlay? 


通过 “Overlay?” 可 以 查看 overlay 的 信息 .在 这 里 可 以 看 到 设计 中 使 用 到 的 两 个 
AxiGPIO, 如 图 5-14 所 示 。 

3. 对 端口 的 访问 

对 于 端口 的 访问 要 和 原理 图 连接 一 致 ,代码 如 下 : 
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Type: Overlay 

String form: 《pynq. overlay. Overlay object at 0xb431cad0> 

File: /usr/local/lib/python3. 6/dist-packages/pynq/overlay. py 
Docstring: 


Default documentation for overlay /hone/xilinx/jupyter notebooks/Example/design l.bit. The following 
attributes are available on this overlay: 


IP Blocks 
axi gpio 0 : pynq.lib.axigpio. AxiGPIO 
axi gpio l : pynq.lib.axigpio. AxiGPIO 


图 5-14 Overlay 信息 


gpio 0 - overlay.ip dict['axi gpio 0'] 
gpio A = AxiGPIO(gpio 0).channell 
gpio B - AxiGPIO(gpio 0).channel2 
gpio 1 = overlay.ip dict['axi gpio 1'] 
gpio S - AxiGPIO(gpio 1).channell 


4. GPIO 口 的 读 写 
对 gpio A 和 gpio_B 两 个 端口 写 入 0 和 1 ,通过 读 取 gpio_S 值 来 判断 是 否 与 预期 的 结 
果 (S 二 AB) 一 致 ,进而 判断 设计 是 否 正确 。 代 码 如 下 : 


mask = Obl 

gpio A.write(0b0, mask) 
gpio B.write(0bl,mask) 
S= gpio S.read() 
print(S) 


第 6 章 


CHAPTER 6 


硬件 描述 语言 (Hardware Description Language. HDL) 是 以 编写 代码 的 方式 来 描述 硬 
件 模 块 及 其 功能 的 语言 。 相 比 原理 图 ,硬件 描述 语言 在 描述 大 型 复杂 硬件 系统 时 效率 更 高 。 
常用 的 硬件 描述 语言 有 Verilog HDL 和 VHDL。Verilog HDL 的 优点 是 语法 类 C, 由 于 计 
算 机 类 的 学 生 通 常 具 有 C 语言 的 编程 基础 ,因此 可 以 快速 掌握 Verilog HDL 的 编写 。 但 缺 
点 也 是 因为 语法 太 像 C 语言 ,学 生 容易 与 软件 编程 混淆 ,从 而 用 软件 设计 的 思维 来 进行 
Verilog HDL 编写 ,最 终 导致 不 可 综合 的 设计 。 而 VHDL 相反 ,其 语法 更 加 严谨 并 需要 一 
ERRA ANE, 但 优点 是 没有 软件 编程 的 历史 包 裕 ,一 开始 学 生 就 以 硬件 的 思维 来 使 用 

。 因 为 硬件 描述 语言 本 质 上 是 对 某 个 硬件 模块 的 描述 ,因此 Verilog HDL 和 VHDL i£ 
ERAN. 总 体 来 说 ,使 用 任何 一 种 语言 都 是 可 以 的 ,在 同一 个 工程 中 ,这 两 种 设计 语 
言 也 可 以 混合 使 用 ,只 要 同一 个 模块 选 定 一 种 就 可 以 。 企 业 在 招聘 时 也 通常 将 这 两 种 语言 
的 技能 同等 看 待 。 

本 章 仅 介 绍 数字 逻辑 及 计算 机 组 成 原理 实验 所 需要 的 最 基本 的 HDL 知识 ,方便 学 生 
快速 和 人 门 。 鉴 于 网 络 上 有 大 量 公开 的 HDL 教程 ,更 为 详细 的 介绍 请 自行 参考 相关 资料 。 
考虑 到 不 同学 校 的 使 用 习惯 ,这 里 给 出 了 Verilog 和 VHDL 对 照 的 版 本 。 也 希望 更 有 利于 
读者 理解 HDL 是 硬件 描述 的 本 质 。 


6.1 “模块 ”的 描述 


“模块 ?是 Verilog HDL 和 VHDL 描述 的 最 基本 单元 ,复杂 的 系统 则 可 以 通过 模块 的 
层次 化 典 套 使 用 来 完成 。 如 图 6-1 是 两 种 语言 对 模块 的 描述 : 在 VHDL 中 ,模块 描述 的 关 
键 词 叫 Entity, 也 就 是 实体 ,Entity 部 分 只 关注 该 模块 的 外 在 表现 如 模块 名 称 、 输 入 /输出 端 
口 。 而 对 于 模块 内 部 功能 的 详细 描述 是 由 Entity 对 应 的 Architecture 部 分 来 完成 的 。 
Architecture 的 描述 也 分 为 两 部 分 : 在 Architecture 和 Begin 之 间 是 对 该 模块 所 用 的 变量 
和 信号 进行 的 声明 。Begin 之 后 才 是 真正 的 模块 功能 的 详细 描述 。 

Verilog HDL 的 语法 则 要 简洁 一 些 。Verilog 中 模块 的 关键 字 就 是 Module, 而 对 于 该 
模块 的 输入 /输出 端口 、 内 部 所 用 的 变量 以 及 模块 功能 的 详细 描述 都 在 Module 和 
Endmodule 之 间 的 区 域内 完成 。 
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VHDL Verilog HDL 
entity 实体 名 is module 模块 名 (端口 表 ) 
port( 输 入 /输出 端口 说 明 ) 输入 /输出 端口 说 明 


end 


Architecture …is 


内 部 信号 变量 说 明 ; 内 部 说 明 部 分 ; 
begin 

并 行 执行 语句 ; 并 行 执行 语句 ; 
end 结构 体 名 ; endmodule 


图 6-1 模块 描述 的 基本 框架 


6.1.1 输入 /输出 端口 说 明 


下 面 举 例 说 明 输入 /输出 端口 的 声明 : 
1. VHDL 


Entity mux4 is 
Port (s: in std logic vector(1 downto 0); 
a,b,c,d: in std logic vector(7 downto 0); 
y: out std logic vector( 7 downto 0)); 
End mux4; 


在 VHDL 中 ,模块 输入 /输出 端口 的 声明 是 在 Entity 中 ,在 此 说 明 每 个 输入 /输出 端口 
的 名 称 、 方 向 、 端 口 的 类 型 及 宽度 。 例 如 s: in std_logic_vector(1 downto 0), 其 中 s 是 端口 
名 称 ; in 是 端口 的 方向 ,说 明 此 处 是 输入 端口 ; std_logic_vector 是 端口 的 类 型 ,此 处 是 标准 
的 逻辑 向 量 类 型 ; (1 downto 0) 是 端口 的 宽度 ,此 处 是 2 位 ,最 右边 是 第 0 位 。 

2. Verilog HDL 


module kmux4 1(s, a, b, c, d, y); 
input[1:0] s; 
input [7:0] a, b, c, d; 
output[7:0] y; 


在 Verilog 中 ,模块 名 称 后 面 的 括号 里 ,可 以 只 列 出 输入 /输出 端口 的 名 称 ,如 (s, a, b, 
c,d，y)。 而 在 下 面 进 一 步 说 明 端 口 的 方向 数据 宽度 。 如 inputL1:0] s,input 是 端口 的 方 
向 ,说 明 s 是 输入 端口 ; 数据 宽度 是 2 位 ,最 右边 的 是 第 0 位 。 


6.1.2 数据 对 象 和 数据 类 型 

VHDL 的 数据 对 象 有 常量 、 信 号 和 变量 ,分 别 表 达 不 同 的 硬件 对 应 概念 。 每 种 对 象 都 
可 以 设置 为 不 同 的 数据 类 型 ,可 以 明确 表达 各 种 具体 或 抽象 的 数据 。 数 据 使 用 时 必须 进行 
类 型 说 明 ,运算 时 必须 考虑 类 型 的 一 致 性 。 

Verilog HDL 的 数据 对 象 有 常量 和 变量 。 其 中 变量 分 为 连 线 型 (wire) 和 寄存 器 型 
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(reg), wire 型 类 似 于 信和 号。 而 reg 型 类 似 于 变量 ,只 能 在 子 程序 块 中 赋值 。 数 据 变量 默认 
为 wire 型。 在 VHDL 中 与 之 对 应 的 是 signal( 与 wire 对 应 ) 和 variable( 与 reg 对 应 ) 。 


6.1.3 顺序 语句 与 并 行 语句 


两 种 语言 的 语句 都 包含 并 行 语句 和 顺序 语句 。 并 行 语句 在 主 程序 中 使 用 ,其 代码 出 现 
的 顺序 和 执行 的 顺序 无 关 , 所 有 的 并 行 语句 是 并 行 执行 的 。 而 顺序 语句 只 能 在 子 结构 中 使 
用 ,执行 顺序 和 代码 的 出 现 顺 序 相关 。 

如 图 6-2 所 示 ,VHDL 中 的 process…end process 之 间 以 及 Verilog 中 的 always…end 
之 间 都 是 并 行 语句 块 。 意 思 是 多 个 process, 多 个 always 代表 的 语句 块 是 得 到 并 行 执行 的 ， 
和 其 出 现 的 顺序 无 关 。 而 其 内 部 的 语句 是 顺序 语句 ,执行 是 按 出 现 的 先后 顺序 进行 的 。 

举例 说 明 : 


VHDL Verilog HDL 
并 行 语句 块 并 行 语 句 块 
process (敏感 表 ) always @( 敏 感 表 ) 
begin begin 

顺序 语句 ， 顺序 语句 ， 
end process; end 


图 6-2 并 行 语句 与 串 行 语句 


因此 ,如 果 想 要 使 多 个 语句 得 到 并 行 执行 ,就 将 其 放 入 到 多 个 process/always 中 (也 许 
使 隐 含 的 , 即 不 显 式 地 出 现 process/always 的 关键 字 ); 如 果 想 要 使 多 个 语句 得 到 先后 的 串 
行 执 行 ,就 将 其 放 入 到 一 个 process/always 语句 块 的 内 部 。 


6.2 模块 基本 用 法 示例 


下 面 用 若干 基本 功能 部 件 的 HDL 描述 为 例 , 说 明 模 块 的 基本 用 法 。 


6.2.1 八 位 乘法 器 
用 VHDL 和 Verilog HDL 代码 描述 八 位 乘法 器 。 


1. VHDL 描述 

LIBRARY IEEE; -- 引 入 IEEE HE 
USE IEEE. STD_LOGIC 1164. ALL; -- 引 入 1164 包 
ENTITY mul IS 


port( a, b: IN integer range 0 to 255; 
q: OUT integer range 0 to 65535); 
END mul; 
ARCHITECTURE one of mul is 
BEGIN 
q«-a * b; 一 -此 处 做 乘法 
END one; 
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2. Verilog HDL 描述 


module mul8v (a, b, q); 


input[7:0]a, b; // 端 口 定义 和 乘法 在 同一 个 区 域 完 成 
output[15:0] q; 
assignq = a * b; // 此 处 做 乘法 

endmodule 


从 上 述 的 代码 示例 中 可 以 更 好 地 理解 HDL 是 对 硬件 的 描述 ,不同 的 HDL 可 以 描述 同 
一 个 硬件 模块 ,只 是 具体 语法 稍 有 差异 。 

从 上 述 例子 中 还 可 以 体会 HDL 在 描述 硬件 时 的 优点 ,就 是 当 设 计 一 个 乘法 器 时 ,并 不 
一 定 需 要 完全 了 解 乘法 器 的 内 部 架构 的 细节 ,而 是 仅 用 a *b 表示 。 通 过 EDA 工具 综合 之 
后 生成 乘法 器 的 具体 硬件 架构 。 因 此 一 定 程度 上 提升 了 抽象 层次 ,降低 了 对 用 户 的 底层 硬 
件 细节 能 力 的 需求 。 这 种 描述 硬件 行为 而 不 是 硬件 具体 架构 细节 的 方式 就 叫 作 “行为 描 
述 ”, 与 之 对 应 的 描述 底层 细节 架构 的 方式 叫 作 “ 结 构 描 述 "。 在 进行 系统 设计 时 通常 采用 的 
是 上 述 两 种 描述 方式 的 混合 模式 。 复 杂 度 高 的 模块 先 用 结构 描述 拆 分 成 多 个 子 模块 的 连 
接 , 对 于 功能 简单 的 模块 再 采用 行为 描述 ,这 样 设计 的 系统 较 方便 成 功 综合 。 


6.2.2 译 码 器 


三 一 八 译 码 器 的 示意 图 如 图 6-3 所 示 。ENA 是 译 码 器 的 使 能 控制 输入 端 , 当 ENA=1 
时 , 译 码 器 不 工作 ,此 时 YL7:0]=11111111( 译 码 器 的 输出 


A 
有 效 电 平 为 低 电 平 )。 当 ENA=0 时 , 译 码 器 工作 。C、B、A B Y[7.0]|— 
是 3 位 宽度 的 数据 输入 端 。 译 码 器 处 于 工作 状态 时 , 当 


CBA=000,Y[7:0]=11111110( 即 Y[0]—0); 4 CBA— 
001. Y[7:0]—11111101CB] Y[1]—00; 以 此 类 推 。 
1. 三 一 八 译 码 器 的 VHDL 描述 


图 6-3 三 一 八 译 码 器 示意 图 


LIBRARY IEEE; 
USE IEEE. STD LOGIC 1164. ALL; 
ENTITY Decoder IS 
PORT(a, b, c, ena: IN BIT; 
y: OUT BIT VECTOR(7 DOWNTO 0) ) ; 


END Decoder; 
ARCHITECTURE one OF Decoder IS 
BEGIN 
PROCESS(a, b, c, ena) -- 这 是 一 个 可 并 行 的 语句 块 ,ab，c，ena 称 为 敏感 信号 ， 
-- 当 发 生变 化 时 ,会 激发 process 中 的 语句 执行 
VARIABLE cba: BIT VECTOR(2 DOWNTO 0) ; —- cba 是 变量 只 能 在 process 内 部 声明 
—— 和 使 用 ,受到 激发 后 值 立即 发 生变 化 
BEGIN 
cba: = (c &b&a); 一 -把 c、ba 拼接 起 来 变 成 3 位 的 变量 
IF (ena= '1') THENY<= "11111111"; —- 如 果 ena 是 1, 模块 不 工作 
ELSE 


CASE (cba) IS 


WHEN "000" =>Y<= "11111110"; 一 -下 面 这 几 条 语句 顺序 执行 
WHEN "001" =>y<= "11111101"; 

WHEN "010" => y«- "11111011"; 

WHEN "011" => y«- "11110111"; 

WHEN "100" => y«- "11101111"; 

WHEN "101" => y«- "11011111"; 

WHEN "110" -» y«- "10111111"; 

WHEN "111" =>y<= "01111111"; 

WHEN OTHERS = > NULL; -- 如 果 不 是 上 述 值 , 则 输出 NULL 

END CASE; 
END IF; 
END PROCESS; 
END one; 


2. 三 一 八 译 码 器 的 Verilog HDL 描述 的 代码 示例 


module decoder(a, b, c, ena, y); 
input a, b, c, ena; 
output[7:0] y; 

reg[7:0] — y; 


always 
begin 
if (ena==1) y = 'b11111111; 
else begin 
case ((c, b, a]) -- {E cba 用 {} 拼 接 起 来 形成 3 位 
'b000: y= 'b11111110; 
'b001: y= 'b11111101; 
'b010: y= 'b11111011; 
'b011: y= 'b11110111; 
'bl00: y= 'b11101111; 
'bl01: y= 'b11011111; 
"bl10: y= 'b10111111; 
'blll: y= 'b01111111; 
default : y= 'bll1111111; 
endcase 
end 
end 
endmodule 


6.2.3 八 位 二 进 制 比较 器 


设计 一 个 八 位 二 进 制 数据 比较 器 ,AL7:0] 和 BL7:0j 是 两 个 数据 输入 端 ,FA 是 “大 于 ” 
输出 端 ,FB 是 “小 于 ”输出 端 ,FE 是 “等 于 ?输出 端 。 当 AL7:0] 大 于 BL7:0] 时 ,FA 二 1; 当 
AL7:0] 小 于 BL7:0] 时 ,FB==1; 当 AL7:0] 等 于 BL7:0] 时 ,FE 一 1。 

1. 八 位 二 进 制 比较 器 的 VHDL 描述 的 代码 示例 


LIBRARY IEEE; 
USE IEEE. STD LOGIC 1164. ALL; 
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ENTITY comp8 IS 
PORT (a,b : IN STD LOGIC VECTOR(7 DOWNTO 0); 
fa, fb, fe : OUT STD LOGIC); 


END comp8; 
ARCHITECTURE one OF comp8 IS 
BEGIN 
PROCESS(a, b) 
BEGIN 一 下 面 为 顺序 语句 , 且 为 行为 描述 
IFa>bTHEN fa<= '1'; 
fb<= '0'; 
fe<= '0'; 
ELSIFa«b THEN fa<= '0'; 
fb«- '1'; 
fe<= '0'; 
ELSIF a = b THEN fa<= '0'; 
fb«- '0'; 
fe«- '1'; 
END IF; 
END PROCESS; 
END one; 


2. 八 位 二 进 制 比较 器 的 Verilog HDL 描述 


module comp8v(a, b, fa, fb, fe); 
input[7:0] abr 
output fa, fb, fe; 
reg[7:0] fa, fb, fe; 
always( * ) 
begin 
if (a>b) begin fa= 1; fb= 0; fe= 0; end 
else if (a<b) beginfa = 0; fb - 1; fe - 0; end 
else if (a == b) begin fa = 0; fb-0; fe- 1; 
end 
endmodule 


end 


上 面 两 段 代码 示例 都 是 行为 描述 ,具有 一 定编 程 基础 的 读者 都 很 容易 理解 其 功能 。 


6.2.4 JK 触发 器 设计 


JK 触发 器 是 一 种 时 序 电 路 ,其 原理 图 如 图 6-4 所 示 。 其 中 
JK 是 数据 输入 端 ,CLR 是 复位 控制 输入 端 。 当 CLR=0 时 ,和 触 
发 器 的 状态 被 置 为 0 态 。CLK 是 时 钟 输入 端 ,Q 和 QN 是 触发 器 
的 两 个 互补 输出 端 。 

1. JK 触发 器 VHDL 描述 的 代码 示例 

LIBRARY IEEE; 


USE IEEE. STD LOGIC 1164.ALL; 
ENTITY nyjkff IS 


一 


=K o| 
CLR QN[— 
—]1CLK 


图 6-4 JK 触发 器 原理 图 


PORT(j, k, clr: IN STD LOGIC; 
clk: IN STD LOGIC; 
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q, qn: BUFFER STD LOGIC) ; 一 - 带 缓冲 的 输出 端口 
END myjkff; 
ARCHITECTURE one OF myjkff IS 
BEGIN 
PROCESS(j, k, clr, clk) 
VARIABLE jk: STD LOGIC VECTOR(1 DOWNTO 0); -- 让 是 变量 
-- 只 在 process 内 部 有 效 
BEGIN 
jk:= (j&k); 
IFclr-'0'THEN q«-'0'; qn<= "1'; 
ELSIF clk'EVENT AND clk = '0' THEN --clk 时 钟 信号 的 下 降 沿 
CASE jk IS 
WHEN "00" =>q «7g; qn«- qn; 
WHEN "01" =>q <= '0'; qn<= '1'; 
WHEN "10" =>q <= '1'; qn«- '0'; 
WHEN "11" =>q <= NOTq; qn<= NOT qn; 
WHEN OTHERS => NULL; 
END CASE ; 
END IF; 
END PROCESS; 
END one; 
2. JK 触发 器 Verilog HDL 描述 的 代码 示例 
module myjkff (j, k, clr, clk, q, qn); 
input T ko ciri cik; 
output q, qn; 
reg q, qn; 
always @ (negedge clr or negedge clk) // 下 降 沿 触发 
begin 
if (一 clr) beginq = 0; qn = 1; end 
else 
case ((j,k]) 
2'b00: beginq = q; qn - qn; end 
2'b01: beginq = 0; q= 1; end 
2'bl0: beginq - 1; qn - 0; end 
2'bli: beginq = ~q; qn = —qn; end 
default beginq = 0; qn= 1; end 
endcase 
end 
endmodule 


6.3 层次 化 设计 


6.3.1 描述 方式 


在 介绍 层次 化 设计 之 前 ,首先 介绍 一 下 HDL 的 描述 方式 ,就 是 采用 HDL 如 何 描述 一 
个 具体 的 硬件 。 描 述 方式 总 体 上 可 以 分 为 三 种 : 行为 描述 、 结 构 描 述 及 混合 描述 。 
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1. 行为 描述 

行为 描述 是 指 硬件 模块 的 输入 /输出 的 响应 情况 或 其 行为 ,而 不 指定 具体 的 硬件 结构 。 
图 6-5 所 示 是 对 该 模块 的 描述 ,只 是 关注 其 输出 对 输入 的 处 理 行为 ,而 不 关注 其 具体 的 硬件 
细节 。 这 种 描述 方式 的 优点 是 对 硬件 细节 要 求 较 低 , 方 便 用 户 设计 ,方便 通过 阅读 代码 理解 
硬件 功能 。 但 其 局 限 性 是 ,不 能 描述 过 于 复杂 的 系统 ,如 果 描 述 过 于 复杂 的 系统 会 造成 不 能 
综合 的 结果 ,也 就 是 EDA 工具 无 法 根据 用 户 的 行为 描述 自动 生成 对 应 的 真实 硬件 。 所 以 
行为 描述 的 结果 可 用 于 仿真 ,对 于 不 太 复 杂 的 模块 ,也 可 以 用 于 综合 。 


input 1, *** , input n IF input | THEN output 1, *** , output 7 
FOR j IN high DOWNTO low LOOP 
shfi(j):-shfi); 
END LOOP; 
output 1<=shft AFTER 5ns 


图 6-5 行为 描述 示例 


2. 结构 描述 

和 行为 描述 相对 应 ,结构 描述 关注 的 是 模块 的 结构 , 即 如 何 用 更 低级 的 子 模块 通过 特定 
的 结构 形成 需要 的 模块 。 图 6-6 所 示 顶 层 模 块 的 功能 有 两 个 非 门 以 及 子 模块 1、 子 模块 2 2H 
合 完成 。 它 的 优点 是 由 于 给 出 了 硬件 的 构成 ,EDA 工具 总 能 对 其 进行 综合 生成 具体 的 硬 
件 。 但 缺点 是 ,由 于 要 考虑 具体 的 硬件 架构 ,对 硬件 基础 的 要 求 较 高 , 且 涉及 太 多 细节 ,导致 
开发 效率 低 。 而 且 对 于 硬件 基础 不 是 特别 好 的 用 户 ,通过 阅读 代码 很 难 理解 硬件 完成 的 
功能 。 


DH E> 


A 
fü — 
EM 


p 子 模块 ! 


图 6-6 结构 描述 


3. 混合 描述 

混合 描述 是 上 述 两 种 描述 方式 的 结合 使 用 。 对 于 大 型 复杂 的 系统 ,首先 在 顶层 采用 结 
构 描述 的 方式 进行 顶层 的 功能 划分 和 子 模 块 功能 定义 。 逐 级 进行 功能 的 细 化 ,直到 采用 行 
为 描述 可 以 较 好 完成 的 基本 功能 . 则 采用 行为 描述 完成 。 因 此 就 会 设计 到 在 一 个 功能 模块 
的 内 部 嵌 套 调用 更 低 的 若干 子 模块 ,这 就 涉及 层次 化 设计 。 


6.3.2 层次 化 设计 的 写法 


层次 化 设计 就 是 当 一 个 模块 的 功能 较为 复杂 ,而 需要 把 它 拆 成 若干 子 模块 并 在 上 一 级 
模块 调用 的 设计 方法 。 如 图 6-6 所 示 ,就 是 如 何在 顶层 模块 调用 子 模块 1 和 子 模块 2 的 设 


计 , 就 是 层次 化 设计 。 
1. 层次 化 设计 的 VHDL 描述 


LIBRARY IEEE; 

USE IEEE.STD LOGIC 1164. ALL; 

ENTITY Topmodule IS 

port( a, b: IN integer range 0 to 255; 

q: OUT integer range 0 to 65535); 

END Topmodule ; 

ARCHITECTURE one of Topmodule 
signal nea : 


is 

integer range 0 to 255; 
integer range 0 to 255; 
: integer range 0 to 255; 
: integer range 0 to 255; 


一 -此 处 先 声明 内 部 所 用 的 信号 
signal nec : 


signal c 
signal d 


component Submodulel 


port ( ines 


end component; 


component Submodule2 


port ( inl : in 


in2 : in 
in3 : in 
outl : out 


); 


end component; 


BEGIN 
nea<= nota; 
nec<= notc; 
submodl : Submodulel 
( 


port map 


inl => av 


一 -声明 子 模块 1 
in integer range 0 to 255; 
integer range 0 to 255; 
integer range 0 to 255 


一 -声明 子 模块 2 
integer range 0 to 255; 


integer range 0 to 255; 
integer range 0 to 255; 


integer range 0 to 255 


一 进行 信号 的 赋值 ,是 并 行 语句 


一 -使 用 子 模块 1, 将 其 实例 化 
一 -并 和 相关 信号 连接 


outi => c, 
out2 => d); 


Submod2 : Submodule2 


-- 使 用 子 模块 2 


port map ( inl => nea, 
in2 => nec, 
in => d, 
outl => q); 
END one; 


如 上 所 述 ,VHDL 代码 中 需要 用 到 子 模块 时 .需要 在 Architecture- Begin 之 间 声 明子 


模块 ,说 明 其 输入 /输出 端口 。 
具体 调用 子 模 块 , 需 要 在 


Begin…End 之 间 将 声明 的 子 模块 实例 化 ,可 以 根据 需要 实例 
化 多 个 。 并 将 其 输入 /输出 端口 和 相关 的 信号 关联 起 来 ,此 时 子 模块 就 不 是 一 个 孤立 的 模 
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块 ,而 是 可 以 和 其 他 系统 协同 工作 了 。 
2. 层次 化 设计 的 Verilog HDL 描述 


module Topmodule (a, b, q); 
input[7:0] a, b; 
output [15:0] q; 
wire [7: 0] nea, nec, c, d; 


assign nea - nota; // 进 行 信号 的 赋值 ,是 并 行 语 句 
assign nec = notc; 
submodl Submodulel // 使 用 子 模块 1, 将 其 实例 化 
( .ini(a), // 并 和 相关 信号 连接 
.outl(c), 
.out2(d)); 


submod2  Submodule2 
( . inl(nea), 
.in2(nec), 
.in3(d), 
.outl(q)); 
Endmodule 


如 上 所 述 ,Verilog HDL 代码 中 需要 用 到 子 模块 时 ,无 须 声 明 直 接 调用 即 可 。 具 体 调用 
子 模块 ,对 其 进行 例 化 并 将 其 输入 /输出 端口 和 相关 的 信号 关联 起 来 即 可 。 

通过 上 面 的 介绍 ,在 完成 实验 设计 时 ,就 可 以 通过 把 一 个 复杂 的 系统 划分 成 子 模块 ,最 
终 通 过 层次 化 的 方式 完成 整个 系统 。 

上 面 介绍 了 HDL 的 功能 模块 的 基本 结构 和 设计 方法 ,以 及 利用 层次 化 设计 方法 设计 
更 复杂 的 系统 ,下 面 简单 介绍 一 下 VHDL 和 Verilog HDL 的 语言 基础 。 


6.4 VHDL 语言 基础 


6.4.1 标识 符 

标识 符 用 来 定义 常数 .变量 .信和 号、 端口 . 子 程序 或 参数 的 名 字 ,由 字母 (A 一 Z,a 一 2) 、 数 
字 (0 一 9) 和 下 画 线 (_) 字 符 组 成 。VHDL 规定 首 字符 必须 是 字母 ,未 字符 不 能 为 下 画 线 。 
不 允许 出 现 两 个 连续 的 下 划 线 。 不 区 分 大 小 写 。VHDL 定义 的 保留 字 ( 关 键 字 ) 不 能 用 作 
标识 符 , 标 识 符 字符 最 长 可 以 是 32 个 字符 。 

6.4.2 数据 对 象 

常用 的 数据 对 象 有 常量 .变量 和 信和 号: 

CD 常量 是 对 某 一 常量 名 赋予 一 个 固定 的 值 , 而 且 只 能 赋值 一 次 。 通 常 赋值 在 程序 开 
始 前 进行 ,该 值 的 数据 类 型 则 在 说 明 语句 中 指明 。 用 法 如 下 : 

Constant 常数 名 : 数据 类 型 : = 表达 式 

Constant Vcc: real: =5.0; 一 -定义 Vcc 的 数据 类 型 是 实数 ,赋值 为 5. 0V 


(2) 变量 只 能 在 进程 语句 、 函 数 语 句 和 过 程 语句 结构 中 使 用 。 变 量 的 赋值 是 直接 的 , 非 
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预 设 的 。 分 配给 变量 的 值 立即 成 为 当前 值 。 变 量 不 能 表达 “ 连 线 ”或 存储 元 件 , 不 能 设置 传 
输 延 时 量 。 

Variable 变量 名 : 数据 类 型 := 初始 值 ; 

Variable count: integer 0 to 255: = 20; -- 定义 count 整数 变量 ,变化 范围 0 一 255, 初 始 值 为 20 

变量 赋值 语句 : 目标 变量 名 : = KER; 

x: 710.0; -- 实数 变量 赋值 为 10.0 

(3) 信号 表示 逻辑 门 的 输入 或 输出 ,类 似 于 连接 线 。 也 可 以 表达 存储 元 件 的 状态 。 信 
号 通常 在 构造 体 \ 程 序 包 和 实体 中 说 明 。 

Signal 信号 名 : 数据 类 型 : = 初始 值 


Signal clock: bit : = '0'; 一 -定义 时 钟 信号 类 型 ,初始 值 为 0 
信号 赋值 语句 : 目标 信号 名 <= 表达 式 ; 

FL 

Z«-xafter 5 ns; —- HE 5ns JE f x f) f WT z 
6.4.3 数据 类 型 


数据 类 型 包括 以 下 9 种 。 
1. 布尔 : (Boolean) 


TYPE BOOLEAN IS (FALSE, TRUE); -- 取 值 为 FALSE 和 TRUE, 不 是 数值 ,不 能 运算 ,一 般 用 于 关系 运算 符 
2. fi. (Bi 
TYPE BIT IS ('0', 1); -- Wf Jy 0 fI 1, HIT 3E Eis 94 


3. 位 矢量 : (Bit Vector) 


TYPE BIT VECTOR IS ARRAY (Natural range« >) OF BIT; -- 基于 Bit 类 型 的 数组 ,用 于 逻辑 运算 
SIGNAL a: Bit Vector(0 TO 7); -- 第 0 位 在 最 左边 
SIGNAL a: Bit Vector ( 7 DOWNTO 0) ; 一 第 0 位 在 最 右边 


4. 字符 : (Character) 
TYPE CHARACTER IS (NUL, SOH, STX，…， ”1 -- 通 常用 单 引号 "引起 来 , 区 分 大 小 写 
5. FR.: (String) 


VARIABLE string var: STRING (1 TO 7); 
string var: -"ABCD" ; -- 通 常用 双 引号 "引起 来 ,区 分 大 小 写 


6. 整数 : (Integer) 
取 值 范围 一 (2” 一 1) 一 (22 一 1) ,可 用 32 位 有 符号 的 二 进 制 数 表示 ,如 : 
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variable a: integer range 一 63 to 63 


7. 实数 : (Real) 
取 值 范围 为 一 1. 0E38 一 十 1.0E38, 仅 用 于 仿真 不 可 综合 。 


1.0 一 十 进 制 浮 点 数 
8#43.6#e+4 =- 八进制 浮 点 数 
43.6E- 4 一 十 进 制 浮 点 数 


8. 时 间 : (Time) 
物理 量 数 据 ,完整 的 包括 整数 和 单位 两 个 部 分 ,用 至 少 一 个 空格 隔 开 , 仅 用 于 仿真 不 可 


综合 。 分 别 有 飞 秒 fs、 皮 秒 ps、 纳 秒 ns、 微 秒 ys、 毫秒 ms. Eb sec、 分 min, H} hr. 


效 


9, 错误 等 级 : (Severity Level) 
表示 系统 状态 , 仅 用 于 仿真 不 可 综合 ; 


TYPE severity level IS (NOTE,WARNING,ERROR,FAILURE); 


6.4.4 数据 类 型 转换 


数据 类 型 转换 包括 以 下 几 种 : 
1. 类 型 标记 法 
Variable A: integer; Variable B: real; 


A - integer (B); B - real (A); 

2. 函数 法 

Conv_interger (A); -- 由 std logic 转换 为 integer 型 ,在 std logic unsigned 包 
3. 常数 转换 法 /常量 转换 法 

Type conv table is array(std logic) of bit; 一 - 定义 cony table 的 数据 类 型 为 数组 


Constant table:conv table: = ('0'|'L' =>'0', '1'| 'H' =>'1', others =>'0'); 
=- Constant table 为 具有 转换 表 性 质 的 常数 


Signal a: bit; signal b: std logic; -- $E X a, b 2E JI 
A«- table(b); — f std logic 型 转换 为 bit 型 
4. 属性 


属性 提供 的 是 关于 信号 、 类 型 等 的 指定 特性 ,一 般 常用 有 如 下 三 种 属性 : 

COD. 'event: 若 属性 对 象 有 事件 发 生 , 则 生成 布尔 值 true, 常 用 来 检查 时 钟 边沿 是 否 有 
检查 时 钟 上 升 沿 : Clock' EVENT AND Clock- '1', 

(2) 'range: 用 于 生成 一 个 限制 性 数组 对 象 的 范围 。 设 置 数据 范围 : range. "0 to n"; 


'reverse range."n downto 0", 


(3) "left 生成 数据 类 型 或 数据 子 类 型 的 左边 界 值 ; 'right: 生成 数据 类 型 或 数据 子 类 
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型 的 右边 界 值 ; 'high: 生成 数据 类 型 或 数据 子 类 型 的 上 限 值 ; low: 生成 数据 类 型 或 数据 
子 类 型 的 下 限 值 ; length: 生成 数据 类 型 或 数据 子 类 型 的 长 度 值 。 


6.4.5 运算 符 


运算 符 包括 算术 运算 符 等 7 种 ,详细 如 下 : 

1. 算术 运算 符 

CD 加 (十 ) , 减 (一 ) , 乘 (* ), 除 (/)。 

(2) 取 模 (MOD) „WA (REM): 

取 余 运算 (a REM b) 的 符号 与 a 相同 ,其 绝对 值 小 于 b 的 绝对 值 。 
例如 : (一 5)REM 2 一 (一 1) 5 REM 2=(1) 

取 模 运算 (a MOD b) 的 符号 与 b 相同 ,其 绝对 值 小 于 b 的 绝对 值 。 
例如 : (一 5)MOD 2=1 5 MOD (一 2)=(—1) 

(3) SLL: 将 位 向 量 左 移 , 右 边 移 空位 补 零 。 

(4) SRL: 将 位 向 量 右 移 ,左边 移 空位 补 零 。 

(5) SLA: 将 位 向 量 左 移 ,右边 第 一 位 的 数值 保持 原 值 不 变 。 

(6) SRA: 将 位 向 量 右 移 ,左边 第 一 位 的 数值 保持 原 值 不 变 。 

(7) ROL 和 ROR: 自 循环 左右 移 位 。 


例 : 

"1100"SLL1 = "1000" -=- 左 移 空位 补 零 "1100"SRL1 = "0110" -- 右 移 空位 补 零 
"1100"SLA1 = "1000" -=- 左 移 最 右 值 不 变 "1100"SRRA1 -"1110" ~- 右 移 最 左 值 不 变 
"1100"ROL1 = "1001"  —- 循环 左 移 "1100"ROR1 = "0110" -- 循环 右 移 

(8) 乘 方 (** ) ,绝对 值 (ABS) 。 

2. 关系 运算 符 


等 于 (=) ,不 等 于 (/=), 小 于 (过 ) KFO) ,小 于 等 于 ( 玫 王 ) ,大 于 等 于 (之 一 ) 。 
3. 逻辑 运算 符 

(1) 与 (AND) ,或 (OR)。 

(2) 与 非 (NAND) ,或 非 (NOR)。 

G) 异 或 非 (XNOR) , 非 (NOT), 异 或 (XOR)。 

4. 赋值 运算 符 

CD 为 信号 赋值 二 = 。 

(2) 为 变量 赋值 := 。 

5. 关联 运算 符 

二 过 关联 运算 符 用 来 将 子 模块 的 输入 /输出 端口 与 上 层 模块 中 的 信号 关联 起 来 。 
6. 并 置 操作 符 

&. 并 置 操作 符 用 来 将 信号 合并 成 更 大 宽度 的 信号 。 

SIGNAL a : STD LOGIC VECTOR (3 DOWNTO 0) ; 

SIGNAL d : STD LOGIC VECTOR (1 DOWNTO 0) ; 


a«- '1'&'O'&d(1)&'1' ; -— 元素 与 元 素 并 置 ,并 置 后 的 数组 长 度 为 4 
IFa&d = "101011"THEN… -- 在 下 条件 句 中 可 以 使 用 并 置 符 
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7. 符号 运算 符 
IECHO AE) 


6.4.6 运算 符 优 先 级 


VHDL 的 运算 符 优先 级 从 高 到 低 分 别 是 (同一 行 中 左 高 右 低 ): 
逻辑 运算 符 : NOT, 

算术 运算 符 : ABS. xx ,REM,MOD,/,* ,一 ( 负 号 ) ,十 ( 正 号 ) 。 
并 置 运算 符 : &。 

算术 运算 符 : 一 (减法 ) ,十 (加 法 ) 。 

逻辑 运算 符 : ROR,ROL,SRA,SLA,SRL,SLL。 

关系 运算 符 ; >=,>,<=,<,/=,=, 

逻辑 运算 符 : XNOR.XOR. NOR. NAND.OR. AND, 


6.4.7 VHDL 常用 语法 


VHDL 常用 语法 如 下 : 
1. 简单 赋值 语句 
目标 信号 名 志 王 表达 式 ,举例 如 下 : 


ARCHITECTURE Behavior OF FreDevider IS 
SIGNAL Clk:Std Logic; 
BEGIN 

PROCESS(Clock) 
BEGIN 

IF rising edge(Clock) THEN 

Clk < = NOT Clk; 

END IF; 
END PROCESS; 
Clkout < = Clk; 


2. 选择 信号 赋值 语句 
WITH 选择 表达 式 SELECT 
赋值 目标 信号 < = 表达 式 1 WHEN 选择 值 1, 
表达 式 2 WHEN 选择 值 1, 
表达 式 n WHEN OTHERS; 


选择 值 要 覆盖 所 有 可 能 情况 , 若 不 能 一 一 指定 ,用 OTHERS 为 其 他 情况 找 个 出 口 ; 选 


择 值 必须 互 斥 ,不 能 出 现 条 件 重复 或 重生 的 情况 。 
举例 如 下 : 


LIBRARY IEEE; 
USE IEEE.Std Logic 1164. ALL; 
ENTITY MUX IS 

PORT 
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( Data0, Datal, Data2, Data3: IN Std Logic VECTOR(7 DOWNTO 0); 
Sel: IN Std Logic Vector(1 DOWNTO 0); 
DOUT: OUT Std Logic Vector(7 DOWNTO 0) 

) 

END; 

ARCHITECTURE DataFlow OF MUX IS 

BEGIN 

WITH Sel SELECT 
DOUT«-  Data0 WHEN "OO", 
Datal WHEN "O1", 
Data2 WHEN "10", 
Data3 WHEN "11", 
"00000000" WHEN OTHERS; 
END; 


3. 选择 信号 赋值 语句 


赋值 目标 信号 <= ”表达 式 1 WEEN 赋值 条 件 1 ELSE 
表达 式 2 WHEN 赋值 条 件 2 ELSE 
表达 式 n WHEN 赋值 条 件 n ELSE 
表达 式 ; 


各 赋值 语句 有 优先 级 的 差别 , 按 书 写 顺序 从 高 到 低 排 列 ; 各 赋值 条 件 可 以 重 琶 。 举 例 
如 下 : 


LIBRARY IEEE; 

USE IEEE. Std Logic 1164. ALL; 

ENTITY Priority Encoder IS 

PORT 

( I: IN Std Logic VECTOR(7 DOWNTO 0) ; 
A: OUT Std Logic Vector(2 DOWNTO 0) 

) 


END; 

ARCHITECTURE DataFlow OF Priority Encoder IS 

BEGIN 

A«-"lll" WHEN I(7) = 1' ELSE 

"110" WHEN I(6) = '1' ELSE 
"101" WHEN I(5) = '1' ELSE 
"100" WHEN I(4) = '1' ELSE 
"Oll" WHEN I(3) = 1' ELSE 
"010" WHEN I(2) = '1' ELSE 
"O01" WHEN I(1) = '1' ELSE 
"000" WHEN I(0) = '1' ELSE 
"igat; 

END; 


4. 进程 (PROCESS) 语 名 
进程 语句 定义 顺序 语句 模块 ,用 于 将 从 外 部 获得 的 信号 值 , 或 内 部 的 运算 数据 向 其 他 的 
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信号 进行 赋值 。 多 个 进程 之 间 是 并 行 的 ,但 进程 内 部 是 顺序 语句 。 进 程 只 有 在 特定 的 时 刻 
(敏感 信号 发 生变 化 时 ) 才 会 被 激活 。 


[进程 标号 : ] PROCESS (敏感 信号 参数 表 ) 


[声明 区 ]; 
BEGIN 
顺序 语句 
END PROCESS 【进程 标号 ]; 
举例 如 下 : 


ARCHITECTURE Behavior OF FreDevider IS 
SIGNAL Clk:Std Logic; 
BEGIN 

PROCESS(Clock) 
BEGIN 

IF rising edge(Clock) THEN 

Clk < = NOT Clk; 

END IF; 
END PROCESS; 
Clkout < = Clk; 


5. 顺序 语句 

顺序 语句 仅 出 现在 进程 和 子 程序 中 。 顺 序 语句 综合 后 ,映射 成 实际 的 门 电路 ,系统 一 上 
电 , 门 电路 开始 工作 。 电 路 可 实现 逻辑 上 的 顺序 执行 ,实际 上 所 有 门 电路 都 是 并 行 工作 的 。 

(1) 赋值 语句 ,举例 如 下 : 


ENTITY TEST Signal IS 
PORT 
( Reset, Clock: IN Std logic; 
NumA, NumB: OUT Integer RANGE 0 TO 255 
) 
END; 
ARCHITECTURE TEST OF TEST Signal IS 
SIGNAL A, B: Integer RANGE 0 TO 255; 
BEGIN 
PROCESS (RESET, Clock) 
VARIABLE C: Integer RANGE 0 TO 255; 
BEGIN 
IF RESET - '1' THEN 
A<=0; B<=2;C:=0; 
ELSEIF rising_edge(Clock) THEN 
C:=C+1;A<=C+1;B<=A+2; 
END IF; 
END PROCESS; 
Num A< - A; NunB« = B; 
END; 
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(2) IF 语句 ,举例 如 下 : 


亚 条 件 式 THEN 

顺序 语句 
ELSEIF 条 件 式 2 
THEN 

顺序 语句 
ELSE 

顺序 语句 
END IF; 


IF 条 件 式 THEN 
顺序 语句 
END IF; 
IF 条 件 式 THEN 
顺序 语句 
ELSE 
顺序 语句 
END IF; 


ENTITY COMP GOOD IS 
PORT(al IN BIT; 
bl IN BIT; 
qi Eo] Err ); 
END; 
ARCHITECTURE one OF COMP GOOD IS 
BEGIN 
PROCESS (a1, bl) 
BEGIN 
IF al»bl THEN ql <= '1'; 
ELSE ql<= '0'; 
IF; 
PROCESS ; 
END ; 


(3) Case 语句 ,举例 如 下 : 


CASE 表达 式 IS 
HEN 选择 值 [| 选择 值 ] = > 顺 
WHEN 选择 值 [| 选择 值 ] = > 顺 
WHEN OTHERS = > 顺序 语句 ; 
END CASE; 


ig; 


JEFE (LAS np 3R A sk dE 8.4 CASE 语句 的 选择 值 无 法 覆盖 所 有 的 情况 时 ,要 用 


OTHERS 指定 未 能 列 出 的 其 他 所 有 情况 的 输出 值 。 


LIBRARY IEEE; 
USE IEEE. Std_Logic 1164. ALL; 
ENTITY MUX IS 
PORT 
( Data0, Datal, Data2, Data3: IN Std Logic VECTOR(7 DOWNTO 0); 
Sel: IN Std Logic Vector(1 DOWNTO 0); 
DOUT: OUT Std Logic Vector(7 DOWNTO 0) 
) 
END; 
ARCHITECTURE DataFlow OF MUX IS 
BEGIN 
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CASE Sel IS 
WHEN "00" => DOUT<=  Data0; 
WHEN "01" => DOUT<=  Datal; 
WHEN "10"-» DOUT<=  Data2; 
WHEN "11"-» DOUT<= Data3; 
WHEN OTHERS =>  DOUT« = "00000000"; 

END CASE; 

END PROCESS; 
END; 


(4) LOOP 语句 ,举例 如 下 : 


[LOOP 标号 :] FOR 循环 变量 IN 循环 次 数 范围 LOOP 
顺序 语句 
END LOOP [LOOP 标号 ]; 
Sum: = 0; 
FOR i INO TO 9 LOOP 
Sum: = Sum t i; 
END LOOP; 


G) NEXT 语句 ,举例 如 下 : 

NEXT 语句 主要 用 在 LOOP 语句 执行 中 有 条 件 或 无 条 件 转向 控制 , 跳 向 LOOP 语句 
的 起 点 。 

NEXT [循环 标号 ] [WHEN 条 件 ]; 

。 NEXT; 一 一 无 条 件 终 止 当 前 循环 , 跳 回 到 本 次 循环 LOOP 语句 处 ,开始 下 一 次 


循环 。 
。 NEXT LOOP 标号; 一 一 当 有 多 重 LOOP ifi^] i £n SIR a bs LOOP i 
句 处 ,重新 开始 执行 循环 操作 。 


* NEXT LOOP 标号 WHEN 条 件 表 达 式 ; 一 一 条 件 表达 式 为 TRUE ,执行 NEXT if 
句 , 进 入 跳 转 操作 ,否则 向 下 执行 。 

(6) EXIT 语句 : EXIT 语句 主要 用 在 LOOP 语句 执行 中 有 条 件 或 无 条 件 内 部 转向 控 
制 , 跳 向 LOOP 语句 的 终点 ,用 于 退出 循环 。 当 程序 需要 处 理 保护 、 出 错 和 警告 状态 时 ， 
EXIT 语句 能 提供 一 个 快捷 、 简 便 的 方法 。 

EXIT [循环 标号 ] [WHEN 条 件 ]; 

* EXIT; 一 一 无 条 件 从 当前 循环 中 退出 。 

。 EXIT LOOP 标号 ; 一 一 程序 执行 退出 动作 无 条 件 从 循环 标号 所 标明 的 循环 中 退出 。 

* EXIT LOOP 标号 WHEN 条 件 表达 式 ; 一 一 条 件 表达 式 为 TRUE, 程 序 从 当前 循 

环 中 退出 。 

(7) NULL 语句 。 

NULL 为 空 操作 语句 ,一 般 用 于 CASE 中 ,表示 在 某 些 情况 下 对 输出 不 作 任 何 改 变 , 隐 
含 锁 存 信号 。 不 能 用 于 纯 组 合 逻 辑 电路 。 举 例 说 明 如 下 : 


PROCESS (Clock) 
BEGIN 
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IF rising edge (Clock) THEN 


IF; 
END PROCESS; 


6.5 Verilog HDL 语言 基础 


6.5.1 数据 类 型 


wire 型 数据 常用 来 表示 用 于 以 assign 关键 字 赋 值 的 组 合 逻 辑 信 号 。Verilog 的 module 
中 输入 /输出 信号 类 型 默认 时 自动 定义 为 wire 型 。wire 型 信号 可 以 用 作 任 何 表达 式 的 输 
入 ,也 可 以 用 作 assign 语句 或 实例 元 件 的 输出 。 用 法 与 VHDL 中 的 signal 对 应 。 

寄存 器 是 数据 储存 单元 的 抽象 ,寄存 器 数据 类 型 的 关键 字 是 reg。 通 过 赋值 语句 可 以 
改变 寄存 器 储存 的 值 , 其 作用 与 改变 触发 器 储存 的 值 相 当 。reg 型 数据 常用 来 表示 用 于 
always 模块 内 的 指定 信号 , 常 代 表 触 发 器 。 通 常 , 在 设计 中 要 由 always 块 通过 使 用 行为 描 
述 语句 来 表达 逻辑 关系 。 在 always 块 内 被 赋值 的 每 一 个 信号 都 必须 定义 成 reg 型 ,reg 类 
型 数据 的 默认 初始 值 为 不 定 值 'X'。 用 法 与 VHDL 中 的 variable 对 应 。 


reg [width-1 :0]R 变 量 1,R 变量 2; 
wire [width- 1 : 0] W 7E fit 1,W 变量 2; 


例 : 

reg [31:0] out; // 定 义 了 一 个 32 位 的 名 为 out 的 reg 型 数据 
reg rega; // 定 义 了 一 个 一 位 的 名 为 rega 的 reg 型 数据 
wire ifu2biu_icb_cmd_valid;  // 定 义 了 一 个 一 位 的 wire 数据 

Wire ifu2biu icb cmd ready; 


wire [31:0] ifu2biu icb cmd addr; // 定 义 了 一 个 32 位 的 wire 数据 


6.5.2 数字 表示 形式 


数字 表达 方式 有 以 下 三 种 ， 

(D < 位 宽 >< 进 制 >< 数 字 >, 这 是 比较 全 面 的 描述 方式 。 

(2) < 进 制 >< 数 字 >, 在 这 种 描述 方式 中 ,数字 的 位 宽 采用 默认 位 宽 。 

(3) < 数字 >, 在 这 种 描述 方式 中 ,采用 默认 进 制 十 进 制 。 

对 于 < 进 制 > 的 表示 : 二 进 制 整数 用 b 或 B 表 示 , 十 进 制 整数 用 d 或 D 表示, 十 六 进 制 整 
数 用 h 或 HH 表示 ,八进制 整数 用 o 或 O 表示。 

具体 用 法 示例 : 


8'b10101111 // 位 宽 为 8 的 数 的 二 进 制 表 示 ，'"b 表示 二 进 制 
4'ha // 位 宽 为 4 的 数 的 十 六 进 制 , 'h 表示 十 六 进 制 
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下 画 线 Cunderscore) 可 以 用 来 分 隔 开 数 的 表达 以 提高 程序 可 读 性 。 但 不 可 以 用 在 位 宽 
和 进 制 处 ,只 能 用 在 具体 的 数字 之 间 。 见 下 例 : 


16'b1010 1011 1111 1010 // 合 法 格式 
8'b 0011 1010 // 非 法 格式 


6.5.3 parameter 定义 常量 


parameter 可 用 来 定义 常量 , 即 用 parameter 来 定义 一 个 标识 符 代 表 一 个 常量 , 称 为 符 
号 常量 即 标识 符 形式 的 常量 。 采 用 标识 符 代 表 一 个 常量 可 提高 程序 的 可 读 性 和 可 维护 性 。 
parameter 型 数据 是 一 种 常数 型 的 数据 ,其 说 明 格式 如 下 : 


parameter 参数 名 1 = 表达 式 ,参数 名 2= 表达 式 ，…; 


具体 用 法 示例 如 下 : 

parameter DW = 32; // 定 义 参数 DW 为 常量 32 
parameter e- 25, f - 29; // 定 义 二 个 常数 参数 
parameter r= 5.7; // 声 明 x 为 一 个 实 型 参数 


6.5.4 宏 定义 'define 

用 一 个 指定 的 标识 符 ( 即 名 字 ) 来 代表 一 个 字符 串 , 它 的 一 般 形式 为 : 

'define 标识 符 ( 宏 名 ) 字符 串 ( 宏 内 容 ) 

其 作用 是 用 指定 的 宏 名 来 代替 后 面 的 宏 内 容 , 宏 名 一 般 使 用 大 写字 母 以 区 别 变量 
名 。 例 : 


"define E203_ADDR_SIZE 16  //Hi E203 ADDR SIZE 来 代替 16 
'define E203 PC SIZE 16  //RHi E203 PC SIZE 来 代替 16 


在 引用 已 定义 的 宏 名 时 ,必须 在 宏 名 的 前 面 加 上 符号 “'”, 表 示 该 名 字 是 一 个 经 过 宏 定 
义 的 名 字 。 例 : 


output ['E203 PC SIZE- 1:0] inspect pc 


6.5.5 运算 符 及 表达 式 


Verilog HDL 语言 的 运算 符 范 围 很 广 , 其 运算 符 按 其 功能 可 分 为 以 下 几 类 。 
1. 算术 运算 符 ( 十 , 一 ，* , /，%) 

CD 十 (加 法 运算 符 , 或 正 值 运算 符 , 如 regad- regb. +3); 

(2) — (减法 运算 符 , 或 负 值 运算 符 , 如 rega 一 3, 一 3); 

G) * (乘法 运算 符 , 如 rega * 3); 

(4) /( 除 法 运算 符 , 如 5/3); 
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(5) %( 模 运算 符 , 或 称 为 求 余 运 算 符 , 要 求 % 两 侧 均 为 整 型 数据 。 如 7263 的 值 为 1)。 
2. 赋值 运算 符 (=. <=) 

信号 有 两 种 赋值 方式 : 

(1) 非 阻 塞 CNon_Blocking) 赋 值 方式 (< 一 ) : 

CD 块 结束 后 才 完 成 赋值 操作 。 

© b 的 值 并 不 是 立刻 就 改变 的 。 

© 这 是 一 种 比较 常用 的 赋值 方法 ( 绝 大 多 数 情况 下 使 用 非 阻塞 赋值 ) 。 
(2) 阻塞 (Blocking) 赋 值 方式 (=): 

CD 赋值 语句 执行 完 后 , 块 才 结 束 。 

Q b 的 值 在 赋值 语句 执行 完 后 立刻 就 改变 的 。 

O 可 能 会 产生 意 想不到 的 结果 。 

如 图 6-7 给 出 示例 说 明 : 


首先 假设 a 等 于 0 
always@( * ) always@( * ) 
begin begin 
a<=a +l; a=a+tl; 
b<=a +1; b=a 十 1 
end end 
执行 后 a 为 1,b 为 1 执行 后 a 为 1,b 为 2 


图 6-7 阻塞 和 非 阻塞 赋值 比较 


3. 关系 运算 符 ( 二 , <, >=, <=) 

a<b:a 小 于 b 

ac biaXTb 

a <= b: a 小 于 或 等 于 b 

a >= b; a 大 于 或 等 于 b 

4. 逻辑 运算 符 (&&, |l. D 

(D && 逻辑 与 

(2) | | 逻辑 或 

(3) ! 逻辑 非 

“&.&” 和 “|1” 是 二 目 运 算 符 , 它 要 求 有 两 个 操作 数 ,如 : (a>>b)&&(b>c) 或 Ca<b)|| 
(bxze), 

“1” 是 单 目 运算 符 ,只 要 求 一 个 操作 数 ,如 : ! Cao. BH & 和 逻辑 | 是 双 目 运算 符 ， 
逻辑 非 是 单 目 运算 符 。 如 果 操作 数 是 多 位 的 , 则 将 操作 数 看 作 整 体 ,车 操作 数 中 每 一 位 都 是 
0 值 则 为 逻辑 0 值 , 若 操作 数 当 中 有 1, 则 为 逻辑 1 值 。 

5. 条 件 运算 符 (?:) 


assig A = B?C:D // 如 果 B 为 1 则 将 C 赋 给 av 如 果 B 不 为 1 将 D 赋 给 六 
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6. 位 运算 符 ( 一 , |^, 区 ,一 ) 

(1)“ 取 反 ” 运 算 符 一 : 一 是 一 个 单 目 运算 符 , 用 来 对 一 个 操作 数 进 行 按 位 取 反 运算 。 

(2)“ 按 位 与 ”运算 符 &: 按 位 与 运算 就 是 将 两 个 操作 数 的 相应 位 进行 与 运算 。 

(3)“ 按 位 或 ?运算 符 | : 按 位 或 运算 就 是 将 两 个 操作 数 的 相应 位 进行 或 运算 。 

(4)“ 按 位 异 或 ”运算 符 ^( 也 称 之 为 XOR iS SERO : 按 位 异 或 运算 就 是 将 两 个 操作 数 的 
相应 位 进行 异 或 运算 。 

(5)“ 按 位 同 或 "运算 符 ^ 一 : 按 位 同 或 运算 就 是 将 两 个 操作 数 的 相应 位 先进 行 异 或 ; 
算 再 进行 非 运算 。 

(6) 不 同 长 度 的 数据 进行 位 运算 : 两 个 长 度 不 同 的 数据 进行 位 运算 时 ,系统 会 自动 将 
两 者 按 右 端 对 齐 。 位 数 少 的 操作 数 会 在 相应 的 高 位 用 0 填 满 ,以 使 两 个 操作 数 按 位 进行 
操作 。 

7. 移 位 运算 符 (<<,>>) 

<< ( 左 移 位 运算 符 ) 和 >>( 右 移 位 运算 符 )。 其 使 用 方法 如 下 : 


ik 


a>>n 或 a<<n 


a 代表 要 进行 移 位 的 操作 数 ,n 代表 要 移 几 位 。 这 两 种 移 位 运算 都 用 0 来 填补 移出 的 空 
位 。 例 : 
4'bl001 << 2 = 6'b100100; 


4'bl011 << 2 = 6'b101100; 
4'b1101 >> 1 = 4'b0110; 


8. 拼接 运算 符 ({ )) 
这 个 运算 符 可 以 把 两 个 或 多 个 信号 的 某 些 位 拼接 起 来 进行 运算 操作 。 例 : 


qout r <= {16{1'b1}}; // 对 qout_r 的 16 位 每 位 赋 1 


6.5.6 运算 符 优 先 级 
如 图 6-8 是 Verilog HDL 中 的 运算 符 优 先 级 。 
优先 级 别 


?: 低 
图 6-8 运算 符 优 先 级 
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6.5.7 Verilog HDL 常用 语法 


1. if else 语句 
让 语句 是 用 来 判断 所 给 定 的 条 件 是 否 满足 .根据 判定 的 结果 ( 真 或 假 ) 决 定 执 行 给 出 两 


种 操作 中 的 哪 一 个 。 常 用 格式 为 三 种 : 
CD 站 (表达 式 ) 语句 序列 1; 
(2) if CERO 语句 序列 1; 
else 语句 序列 2; 
G) 这 (表达 式 1) 语句 序列 1; 
else if( 表 达 式 2) 语句 序列 2; 
else if( 表 达 式 n) 语句 序列 n; 
else 语句 序列 ntl; 
举例 说 明 如 下 : 
1) always@ ( * ) begin 
if (!clk in) 
en = (clock en | test mode); 
end 
assign clk out = enb &clk in; 
2) if(DEEP -- 0) o vld - i vldl; 
else if(DEEP -- 1) o vld - i vld2; 
else o vld = 0; 


2. case 语句 
case 语句 是 一 种 多 分 支 选择 语句 ,if 语句 只 有 两 个 分 支 可 供 选 择 , 当 实际 问题 中 需要 多 
分 支 选 择 时 ,可 使 用 case 语句 直接 处 理 多 分 支 选择 。 


case( 表 达 式 ) 
值 1: 语句 序列 1; 
值 2: 语句 序列 2; 
fi n: 语句 序列 n; 
default: ”语句 序列 n+1; 

endcase 

举例 说 明 如 下 : 

case(type) 


l'bl: out«c- a t b; 

Ibo: outc- a b; 

default: out <= 0; 
endcase 


3. for 语句 
for 语句 是 循环 语句 ,一 般 形式 为 : 
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for( 表 达 式 1; 表达 式 2; 表达 式 3) 

其 最 简单 的 应 用 如 下 所 示 : 

for( 循 环 变量 赋 初 值 ; 循环 结束 条 件 ; 循环 变量 增值 ) 
举例 说 明 如 下 : 


for(i-0; i«10; i=i+1) begin 
assign fifo rf en[i] = wen & wptr vec r[i]; 

sirv gnrl dffl fifo rf dffl(fifo rf en[i], i dat, fifo rf r[i], clk); 
end 
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CHAPTER 7 


组 成 原理 实验 


随 着 教 指 委 “ 计 算 机 类 系统 能 力 培养 "工作 的 推进 , 越 来 越 多 高 校 的 计算 机 组 成 原理 实 
验 环节 开始 基于 FPGA 采用 Verilog/VHDL 进行 ,师资 力量 比较 强 的 高 校 开 始 让 学 生 设计 
兼容 MIPS 或 ARM 指令 集 的 处 理 器 ,甚至 要 求 自 己 的 处 理 器 上 跑 自 己 的 操作 系统 。 这 些 
做 法 极 大 地 提升 了 学 生 对 计算 机 软 硬 件 整体 系统 的 理解 。 

然而 ,我 们 也 应 该 看 到 ,因为 各 种 条 件 的 限制 ,目前 各 高 校 要 求学 生 基于 FPGA 用 
HDL 设计 处 理 器 时 ,关注 点 主要 在 于 学 生 对 计算 机 组 成 原理 理论 的 掌握 情况 及 逻辑 功能 的 
设计 和 实现 ,考查 的 主要 是 学 生 在 理论 指导 下 从 无 到 有 或 增 量 式 的 系统 设计 能 力 ,比如 一 条 
指令 的 数据 通路 设计 。 进 而 学 会 逐步 地 增加 指令 及 其 对 应 的 数据 通路 ,完成 整个 处 理 器 的 
设计 。 这 种 方式 对 于 学 生 掌握 处 理 器 的 设计 原理 对 于 工业 界 的 设计 经 验 和 设计 规范 借鉴 的 
不 太 多 。 

目前 随 着 开源 指令 集 RISC-V 的 快速 发 展 ,涌现 了 若干 工业 界 人 士 推出 的 开源 RISC-V 
处 理 器 。 个 人 认为 这 些 体 现 工程 考虑 的 开源 项 目 如 能 以 合适 的 方式 引入 高 校 组 成 原理 实验 
中 ,将 会 对 我 们 老师 及 学 生 的 实际 工程 能 力 有 极 大 的 帮助 。 同 时 ,开源 开放 是 信息 技术 发 展 
的 趋势 ,我 们 培养 的 学 生 也 应 该 尽早 地 学 习 如 何 合理 地 利用 开源 项 目 完成 开发 需求 ,并 基于 
开源 项 目 做 更 多 的 创新 工作 ,而 不 是 每 次 都 从 零 开 始 重复 地 造 轮子 。 

因此 ,本 书 拟 通过 引入 开源 的 RISC-V 处 理 器 项 目 ,一 方面 让 学 生 有 机 会 学 习 来 自 工业 
界 工程 师 们 的 代码 设计 .学习 其 设计 理念 和 思想 ; 另 一 方面 可 让 学 生 基 于 开源 项 目 做 进 一 
步 的 工作 ,甚至 反 过 来 为 开源 社区 做 贡献 。 当 然 , 为 了 照顾 到 不 同 的 需求 ,本 书 还 是 简单 介 
绍 了 基于 RISC-V 指令 集 的 处 理 器 的 逐条 实现 方法 。 


7.1 RISC-V 指令 集 


RISC-V 指令 集 使 用 模块 化 的 方式 进行 组 织 ,每 个 模块 使 用 一 个 英文 字母 来 表示 。 
RISC-V 最 基本 也 是 唯一 强制 要 求实 现 的 指令 集 部 分 是 由 工 字母 表示 的 基本 整数 指令 集 。 
使 用 该 整数 指令 子 集 , 便 能 够 实现 完整 的 软件 编译 器 。 其 他 的 指令 子 集 部 分 均 为 可 选 的 模 
块 ,具有 代表 性 的 模块 包括 M/A/F/D/C. fll 7-1 所 示 。 
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表 7-1 基本 指令 子 集 


指令 集 指令 数 描述 
基本 指令 集 
RV32I 47 32 位 地 址 空间 与 整数 指令 ,支持 32 个 通用 整数 寄存 器 
RV32E 47 RV321 的 子 集 , 仅 支 持 16 个 通用 整数 寄存 器 
RV64I 59 64 位 地 址 空间 与 整数 指令 及 一 部 分 32 位 的 整数 指令 
RV1128I 71 128 位 地 址 空间 与 整数 指令 及 一 部 分 64 位 和 32 位 的 指令 
扩展 指令 集 
M 8 整数 乘法 与 除法 指令 
A 11 存储 器 原子 操作 指令 和 Load-Reserved/Store-Conditional 指令 
F 26 单 精度 (32 位 ) 浮 点 指令 
D 26 双 精 度 (64 位 ) 浮 点 指令 ,必须 支持 下 扩展 指令 
€ 46 压缩 指令 ,指令 长 度 为 16 位 


下 面 主要 针对 RV32I 指令 进行 介绍 。 想 了 解 其 他 基本 指令 子 集 可 以 查看 RISC-V 手 
册 。RV32I 指令 子 集 显 示 了 6 种 基本 指令 格式 ,分 别 是 : 用 于 寄存 器 一 寄存 器 操作 的 R 类 
型 指令 ,用 于 短 立 即 数 和 访 存 load 操作 的 工 型 指令 ,用 于 访 存 store 操作 的 S 型 指令 ,用 于 
条 件 跳 转 操作 的 B 类 型 指令 ,用 于 长 立即 数 的 U 型 指令 和 用 于 无 条 件 跳 转 的 本 型 指令 。 
图 7-1 介绍 了 指令 格式 ,图 7-2 列 出 了 RV32I 指令 的 操作 码 。 


31 30 2524 21 20 19 1514 12 11 8 7 6 0 
funct7 TS2 TS1 funct3 rd opcode | R-type 
imm[11:0] rsl funct3 rd opcode |I-type 
imm[11:5] rs2 rsl funct3 imm[4:0] opcode | S-type 
imm[12] imm[10:5] rs2 rs] funct3 imm[4:1] | imm[11] | opcode | B-type 
imm[31:12] rd opcode | U-type 
imm[20] imm[10:1] imm[11] imm[19:12] rd opcode | J-type 


图 7-1 RV321 指 令 格式 


RV32I 指令 只 有 6 种 格式 ,并 且 所 有 的 指令 都 是 32 位 长 ,这 简化 了 指令 解码 。 

另外 RISC-V 指令 提供 3 个 寄存 器 操作 数 , 而 不 是 像 x86-32 一 样 ,让 源 操作 数 和 目的 
操作 数 共享 一 个 字段 。 当 一 个 操作 本 来 需要 有 3 个 不 同 的 操作 数 ,但 是 ISA 只 提供 了 2 个 
操作 数 时 ,编译 器 或 者 汇编 程序 程序 员 就 需要 多 使 用 一 条 move( 搬 运 ) 指 令 来 保存 目的 寄存 
器 的 值 。 

在 RISC-V 中 ,对 于 所 有 指令 要 读 写 的 寄存 器 的 标识 符 总 是 在 同一 位 置 ,意味 着 在 解码 
指令 之 前 ,就 可 以 先 开始 访问 寄存 器 。 在 许多 其 他 的 ISA 中 , 某 些 指令 字段 在 部 分 指令 中 
被 重用 作为 源 目的 地 ,在 其 他 指令 中 又 被 作为 目的 操作 数 (例如 ,ARM-32 和 MIPS-32), 因 
此 为 了 取出 正确 的 指令 字段 就 需要 在 时 序 本 就 可 能 紧张 的 解码 路 径 上 添加 额外 的 解码 逻辑 ， 
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imm[31:12] rd 0110111 
imm[31:12] rd 0010111 
imm[20|10:1|11|19:12] rd 1101111 
imm[11:0] rsl 000 rd 1100111 
imm[l2|10:5] rs2 rsl 000 imm[4:1]ll] | 1100011 
imm[12/10:5] rs2 rsl 001 imm[4:]]1] | 1100011 
imm[12/10:5] rs2 rsl 100 imm[4:1]ll] | 1100011 
imm[12/10:5] rs2 rsl 101 imm[4:1]ll] | 1100011 
imm[12/10:5] rs2 rsl 110 imm[4:1]ll] | 1100011 
imm[12/10:5] rs2 rsl 111 imm[4:1]ll] | 1100011 
imm[11:0] rsl 000 rd 0000011 
imm[11:0] rsl 001 rd 0000011 
imm[11:0] rsl 010 rd 0000011 
imm[11:0] rsl 100 rd 0000011 
imm[11:0] rsl 101 rd 0000011 
imm[11:5] rs2 rsl 000 imm[4:0] 0100011 
imm[11:5] rs2 rs] 001 imm[4:0] 0100011 
imm[11:5] rs2 rsl 010 imm[4:0] 0100011 
imm[11:0] rsl 000 rd 0010011 
imm[11:0] rsl 010 rd 0010011 
imm[11:0] rsl 011 rd 0010011 
imm[11:0] rsl 100 rd 0010011 
imm[11:0] rsl 110 rd 0010011 
imm[11:0] rsl 111 rd 0010011 
0000000 shamt rsl 001 rd 0010011 
0000000 shamt rs] 101 rd 0010011 
0100000 shamt rsl 101 rd 0010011 
0000000 rs2 rsl 000 rd 0110011 
0100000 rs2 rsl 000 rd 0110011 
0000000 rs2 rsl 001 rd 0110011 
0000000 rs2 rsl 010 rd 0110011 
0000000 rs2 rsl 011 rd 0110011 
0000000 rs2 rsl 100 rd 0110011 
0000000 rs2 rsl 101 rd 0110011 
0100000 rs2 rsl 101 rd 0110011 
0000000 rs2 rsl 110 rd 0110011 
0000000 rs2 rsl 111 rd 0110011 
0000 pred suce 00000 000 00000 0001111 
0000 0000 0000 00000 001 00000 0001111 
000000000000 00000 00 00000 1110011 
000000000000 00000 000 00000 1110011 
esr rsl 001 rd 1110011 
esr rsl 010 rd 1110011 
csr rsl 011 rd 1110011 
csr zimm 101 rd 1110011 
csr zimm 110 rd 1110011 
csr zimm 111 rd 1110011 

图 7-2 RV321 指 令 
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Ului 
U auipc 
J jal 

I jalr 

B beq 
B bne 
B blt 

B bge 
B bitu 
B bgeu 
IIb 
Lh 
Iw 
llbu 
Tlhu 
Ssb 
Ssh 
Ssw 

I addi 

I slti 

I sltiu 

I xori 
lori 

I andi 

I slli 

I srli 

I srai 

R add 
R sub 
R sll 

R slt 

R sltu 
R xor 
R srl 

R sra 
Ror 

R and 

I fence 
I fence.i 
Tecall 

I ebreak 
lesrrw 
I csrrs 
I csrrc 
I csrrwi 
I cssrrsi 


I csrrci 
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使 得 解码 路 径 的 时 序 更 为 紧张 。 
在 RISC-V 中 ,立即 数字 段 总 是 存在 符号 扩展 ,而 且 符号 位 总 是 在 指令 中 的 最 高 位 。 这 


意味 着 对 于 可 能 成 为 关键 路 径 的 立即 数 符号 扩展 ,可 以 在 指令 解码 之 前 进行 。 


7.2 基于 RISC-V 的 逐条 增加 指令 式 实验 


FE 台 教学 与 实践 


读者 基于 RISC-V 指令 集 可 以 自行 设计 和 实现 处 理 器 。 下 面 介绍 如 何 通过 逐条 增加 指 
令 , 最 终 实 现 一 个 由 10 条 指令 构建 的 五 级 流水 线 RISC-V 处 理 器 。 这 里 只 涉及 RISC-V 指 


令 集 中 部 分 的 32 位 指令 ,通过 这 些 基 本 指令 使 读者 理解 处 理 器 流水 线 结构 。 本 实验 的 全 部 
代码 包含 在 配套 源 代码 的 对 应 目录 下 。 用 户 可 以 基于 该 处 理 器 进一步 扩展 指令 ,完善 处 理 


器 的 功能 。 该 示例 处 理 器 的 设计 思想 参考 了 OpenMIPS 处 理 器 设计 , 感 兴趣 的 读者 可 以 参 
考 《 自 己 动手 写 CPU) 一 书 来 继续 完善 此 款 RISC-V 处 理 器 。 
部 分 立即 数 指令 的 指令 说 明 如 表 7-2 所 示 。 


表 7-2 立即 数 指令 说 明 


指令 说 明 

ADDI imm[11:0] rsl 000 rd 0010011 
SLLI 0000000 shamt rsl 001 rd 0010011 
XORI imm[11:0] rsl 100 rd 0010011 
ORI imm[11:0] rsl 110 rd 0010011 
ANDI imm[11:0] rsl 111 rd 0010011 


上 述 5 条 指令 为 同一 类 型 ,它们 都 属于 了 类 型 的 32 位 指令 , 低 7 位 都 为 7?b0010011 , 判 


断 指令 的 具体 操作 类 型 则 通过 指令 的 第 12 一 14 位 。 
指令 用 法 : 


addi 
slli 
xori 
ori 

andi 


除了 slli 指令 以 外 ,其 余 的 4 条 指令 是 将 指令 中 的 立即 数 与 rsl 通用 寄存 器 中 的 数据 进 
行 对 应 的 运算 ,最 后 将 运算 结果 保存 到 rd 寄存 器 中 。 立 即 数 在 使 用 时 需要 将 其 有 符号 扩展 


rd rsl immediate 
rd rsl shamt 

rd rsl immediate 

rd rsl immediate 

rd rsl immediate 


// 立 即 数 加 法 运算 
// 立 即 数 左 移 运算 
// 立 即 数 异 或 运算 


// 立 即 数 或 运算 
// 立 即 数 与 运算 


成 32 位 立即 数 后 再 进行 相应 的 运算 。slli 指令 的 立即 数 为 5 位 ,不 需要 进行 扩展 。 
部 分 R 类 型 指令 说 明 如 表 7-3 所 示 。 
表 7-3 R 类 型 指令 说 明 


指令 说 明 

ADD 0000000 rs2 rsl 000 rd 0110011 
SLL 0000000 rs2 rsl 001 rd 0110011 
XOR 0000000 rs2 rsl 100 rd 0110011 
OR 0000000 rs2 rsl 110 rd 0110011 
AND 0000000 rs2 rsl 111 rd 0110011 
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表 7-3 中 5 条 指令 为 同一 类 型 ,它们 都 属于 R 类 型 的 32 位 指令 ,5 条 指令 的 低 7 位 都 
为 7?b0110011 ,判断 指令 的 具体 操作 类 型 同样 通过 指令 的 第 12 一 14 位 。 


指令 用 法 : 

add rd rsl immediate // 加 法 运算 
sll rd rsl immediate // 左 移 运算 
xor rd rsl immediate // 异 或 运算 
or rd rsl immediate // 或 运算 
and rd rsl immediate // 与 运算 


5 条 指令 都 是 读 取 rsl 通用 寄存 器 中 的 数据 与 rs2 通用 寄存 器 中 的 数据 进行 相应 的 运 
算 , 最 后 将 运算 结果 保存 到 rd 寄存 器 中 。 


7.2.1 5 级 流水 介绍 


5 级 流水 线 由 取 指 . 译 码 ,执行 , 访 存 、 回 写 这 5 个 部 分 组 成 。5 级 流水 中 的 各 个 阶段 的 
具体 工作 如 下 : 

CD 取 指 : 读 取 存储 器 中 的 指令 ,同时 确定 下 一 条 指令 的 地 址 。 

(2) 译 码 : 对 取出 的 指令 进行 译 码 ,获得 指令 中 要 读 取 的 寄存 器 值 ,操作 类 型 或 者 立即 
数 等 信息 ,针对 立即 数 进行 有 符号 或 者 无 符号 扩展 等 操作 。 如 果 包 含 转移 指令 且 满 足 转移 
条 件 , 此 阶段 会 给 出 目标 地 址 。 

(3) 执行 : 将 译 码 阶段 发 送出 来 的 数据 根据 操作 类 型 进行 运算 并 发 送出 运算 结果 。 如 
果 执 行 的 指令 为 Load( 读 ) 或 Store( 写 ) 指 令 ,执行 阶段 也 会 计算 读 写 的 地 址 。 

(4) WE: WRA Load( 读 ) 或 Store( 写 ) 指 令 ,将 会 在 此 阶段 访问 存储 器 ,否则 此 阶段 
可 以 忽略 ,执行 阶段 的 数据 将 会 直接 发 送 到 回 写 阶段 。 此 阶段 同时 可 以 判断 是 否 有 异常 需 
要 处 理 , 如 果 有 异常 则 进行 异常 处 理 。 

(5) 回 写 : 将 不 写 人 存储 器 的 运算 结果 写 回 相应 的 目的 寄存 器 。 


7.2.2 单条 指令 的 RISC-V 处 理 器 设计 


处 理 器 设计 是 一 个 相对 复杂 的 工作 ,将 所 有 指令 和 功能 一 次 性 全 部 实现 是 有 一 定 难度 
的 。 可 以 先 从 一 条 指令 入 手 , 再 不 断 地 丰富 处 理 器 的 功能 。 现 在 将 从 上 面 提 到 的 ori 指令 
入 手 , 开 始 RISC-V 处 理 器 的 设计 。 各 模块 的 完整 代码 存放 在 配套 源 代码 的 对 应 目录 下 ,请 
到 清华 大 学 出 版 社 官方 网 站 本 书页 面 下 载 。 

ori 指令 将 操作 数 寄存 器 rsl 中 的 整数 值 与 12 位 立即 数 (进行 符号 位 扩展 ) 进 行 或 (or) 
操作 ,结果 写 回 寄存 器 rd 中 。 


ORI imm[11:0] rsl 110 rd 0010011 


1. 取 指 模块 的 设计 

取 指 模块 的 作用 是 从 指令 存储 器 中 取出 指令 ,并 递增 PC 值 ,给 出 下 一 条 指令 的 地 址 ， 
取 指 模块 的 文件 名 为 pe reg. v, 其 框图 及 代码 如 图 7-3 所 示 。 

当 复 位 信号 有 效 时 ,使 能 为 零 .PC 值 清 零 ; 否则 ,使 能 信号 为 1,PC 值 每 个 时 钟 周期 加 
4。 因 为 对 于 32 位 指令 来 说 ,一 条 指令 对 应 4 字 节 ,PC 值 加 4 意味 着 取 下 一 条 指令 。 
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if id. v 文件 为 取 指 和 译 码 阶段 之 间 的 寄存 器 模块 , 它 将 取 指 阶段 取出 的 指令 暂 存 起 
来 ,等 到 下 一 个 时 钟 周 期 将 取 指 阶段 的 结果 发 送 到 译 码 阶 段 ,其 框图 及 代码 如 图 7-4 Bron o 


pe rego 


pc reg 
(a) pc_reg 模 块 框图 


module pc reg( 
input clk, 
input rst n, 
output reg [31:0] pc, 
cutput reg ce 
); 
always @ (posedge clk or negedge rst_n) begin 
if( rst_n) 
ce € 1'b0; 
else 
ce C Lbl; 
end 
alvays @ (posedge clk) begin 
证 (ce) 
pc € 32b0; 
else 
pc € pc + d'hi; 
end 
endnodule 


(b) pe_reg 模 块 代码 
图 7-3 pc reg 模块 


2. 译 码 模块 的 设计 


id inst[31:0] 
id pc[31:0] 


if id 
(a) if id 模块 框图 


module if id( 
input clk, 
input rst n, 
input [31:0] if po 
input [31:0] if inst, 


output reg [31:0] id pc, 
output reg [31:0] id inst 
) 


always @ (posedge clk or negedge rst n) begin 
if( rst_n) begin 
id pc <= 32'b0; 
id inst <= 32'b0; 
end 
else begin 
id pc C if pc; 
id inst € if inst; 
end 
end 
endnodule 


(b) if_id 模 块 代码 
图 7-4 if id 模块 


译 码 阶段 会 将 取 指 模块 发 送 过 来 的 信息 进行 译 码 , 得 出 指令 中 包含 的 操作 数 。 运 算 类 
型 和 写 人 目的 寄存 器 的 地 址 等 信息 发 送 到 下 一 级 的 执行 阶段 。 译 码 阶段 包含 三 个 文件 , 它 
们 分 别 是 id. v、regfile. vid ex. v。 完 整 代码 在 配套 源 代码 对 应 目录 下 。 

regfile. v 创建 了 一 个 有 32 个 32 位 的 寄存 器 组 ,包含 一 个 写 端口 和 两 个 读 端 口 。 写 入 
寄存 器 和 读 端口 1 的 框图 及 部 分 代码 如 图 7-5 所 示 , 读 端 口 2 的 代码 与 端口 1 相似 ,在 此 不 


WIR. 


id. v 文件 将 指令 的 操作 类 型 操作 数 Y PRIER 2. E AI AAF HU hk Sa EUR OF k 9 
执行 阶段 ,通过 特定 位 来 识别 指令 类 型 和 运算 方式 ,其 框图 及 代码 如 图 7-6 Bron 

首先 判断 指令 是 哪 种 操作 类 型 。 确 定 操作 类 型 后 ,通过 opl 进一步 确定 具体 为 何 种 运 
算 方式 ,根据 指令 信息 判断 是 否 要 读 操 作 数 。 对 于 工 类 型 指令 ori, 由 于 只 需要 读 取 操作 数 
1 ,所 以 读 操作 数 2 为 0, 并 对 立即 数 进行 符号 位 扩展 。 

在 处 理 器 的 流水 线 中 面临 数据 相关 问题 。 数 据 相关 是 指 由 于 相 邻 的 两 条 或 多 条 指令 使 
用 了 相同 的 数据 地 址 而 发 生 的 关联 。 这 里 所 说 的 数据 地 址 包括 存储 单元 地 址 和 寄存 器 地 
址 。 例 如 ,有 如 下 3 条 指令 依次 流入 相应 的 流水 线 中 : 


regfile0 


cik 
raddri[4:0] 


raddr2[4:0] 


ret 
re2 
rst n 


waddr[4:0] 


wdata[31:0] 


we 
regfile 
(a) 寄存 器 模块 框图 
module regfile( 

input rst n, 
input clk, 
input [4:0] waddr, 
input [31:0] wdata, 
input ve, 
input [4:0] raddrl, 
input rel, 
output reg [31:0] rdatal, 
input [4:0] raddr2, 
input re2, 


output reg [31:0] rdata2 
n 


xeg [31:0] nen x. [0:31]; 


always 8 (posedge clk or negedge rst n) begin 


end 


always @ (4) begin 


end 


if(rst n) begin 
if((waddr != 5'b0) && (we)) 
men r[waddr] 《= wdata; 
end 


ifÜxst m) 
rdatal <= 32'b0; 
else if(raddrl 一 8'b0) 
rdatal <= 32'b0; 
else if((raddrl == waddr) && rel && we) 
rdatal < wdata; 
else if (re1) 
rdatal <= mem r[raddri]; 
else 
rdatal <= 37 b0; 


(b) 寄存 器 模块 代码 
图 7-5 寄存 器 模块 


rdata1[31:0] 


/I/[SASSS 


// Wine gts 


RIAR 
[VEERA 
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与 要 读 出 的 地 址 相同 
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ex wd i[4:0] 
ex wdata i[31: 


aluop o[6:0] 
alusel o[2:0] 
regi addr o[4:0] 
reg o[31:0] 
regi read o 
reg2 addr o[4:0] 
reg2 o[31:0] 
exl | read o 
wd o[4:0] 


E wreg.o 


id 
(a) 译 码 模块 框图 


wire [6:0] op = inst i[6:0]; 
wire [2:0] opl = inst i[14:12]; 


case(op) 
T b0010011: begin 立即 数 扎 作 
case (opl) 
3'bll0: begin 
wreg o <= l'bl; 


aluop o 《= op; 


alusel o <= opl; 
regl read o <= l'bl; ESUBEKI 
reg2 read o <= l'b0; 是 否 读 操 作 数 2 
imm “= {{20 {inst_i[31]}} , inst i[31:20]); /立即 数 扩 展 

end 

default: begin 

end 

endcase 
end 


(b) 译 码 模块 代码 
图 7-6 译 码 模块 


ADD RI1,R2,R3; (R2)+(R3)>R1 
SUB R1. R3. R2; (R3)—(R2)™>RI1 
AND R2.RI R3; RD (R3) R2 
例如 上 述 三 条 指令 ,第 三 条 指令 与 前 面 两 条 指令 之 间 存 在 关于 寄存 器 RI 的 先 写 后 读 
(RAW) 数 据 相 关 。 第 三 条 指令 应 该 读 取 的 为 第 二 条 指令 结束 后 RI 的 结果 ,但 由 于 流水 线 
的 原因 ,在 第 三 条 指令 读 取 R1 时 ,前 面 指令 的 执行 结果 还 没有 回 写 到 R1 中 ,因此 会 造成 计 
算 错误 。 
为 了 避免 数据 相关 ,该 RISC-V 处 理 器 中 使 用 了 数据 前 推 的 方法 ,就 是 将 计算 结果 从 产 
生 处 直接 推送 到 后 续 指 令 所 需要 的 相应 位 置 ,从 而 避免 流水 线 暂停 。 图 7-7 显示 了 操作 数 1 
防止 数据 相关 部 分 的 代码 ,如果 发 生 数据 相关 则 从 相应 位 置 读 取 所 需 的 数据 ,否则 直接 读 取 
寄存 器 中 的 结果 给 下 一 阶段 。 操 作 数 2 的 代码 以 此 类 似 , 全 部 代码 请 查看 配套 源 代 码 中 的 
相应 文件 。 
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always @ (€) begin 
证 (stm 
xegl o & 0; 
else if((regl read o) && (ex wreg i) && (ex wd i 一 regl addr o)) 


regl o “= ex wdata i; 
else if((regl read o) bt (nem wreg i) && (mem wd i == regl addr o) 


regl o 《= mem wdata i; 


else if(regl read o) 
regl o 《= regl data i; 

else if(regl read o) 
regl o C ima; 

else 
regl o 0; 


end 


图 7-7 数据 前 推 实现 代码 


id. ex. v 文件 为 译 码 与 执行 阶段 的 寄存 器 , 它 将 译 码 阶段 的 结果 储存 起 来 ,在 下 一 个 时 钟 
周期 发 送 给 执行 模块 。 其 结构 与 取 指 模块 的 寄存 器 结构 类 似 , 其 框图 及 代码 如 图 7-8 所 示 。 


id exo 


id ex 
(a) id_ex 模 块 框图 


always @ (posedge clk or negedge rst n) begin 


ifÜzst n) begin 
ex aluop € 0; 
ex alusel € 0; 
ex regi <= 0; 
ex-reg2 <= 0; 
ex wd <= 0; 
ex wreg <= 0; 
end 
else begin 
ex aluop 《= id aluop; 
ex alusel <= id alusel; 
ex regl <= id regl; 
ex reg2 <= id reg2; 
ex wd <= id wd; 
ex wreg <= id wreg; 
end 


end 


(b) id_ex 模 块 代码 
图 7-8 id_ex 模块 
3. 执行 模块 的 设计 
执行 模块 根据 之 前 译 码 模块 的 结果 ,对 输入 进来 的 操作 数 进 行 相 应 类 型 的 运算 。 该 阶 
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段 包括 ex. v 和 ex mem. v 两 个 文件 。 
ex. Vv 文 件 根据 译 码 模块 发 送出 的 文件 执行 相应 运算 ,其 框图 及 代码 如 图 7-9 所 示 。 


(a) 执行 模块 框图 
always @ (*) begin /通过 译 码 阶 庚 发 送 过 来 的 信息 确定 具体 的 运算 操作 
ifÜrst m 
result <= 0; 
else begin 


case (aluop i) 
T b0010011: begin 
case(alusel i) 
3'bil0: result 《= regli | reg2 i;  // 执 行 相应 的 运算 
default: begin 


result <= 0; 
end 
endcase 
end 
endcase 
end 
end 
(b) 执行 模块 代码 
图 7-9 执行 模块 


将 运算 后 的 最 终结 果 , 即 是 否 写 回 寄存 器 信和 号、 写 回 目的 寄存 器 的 地 址 等 信息 发 送 到 下 
一 个 阶段 ,其 部 分 代码 如 图 7-10 所 示 。 


always @ (*) begin FERGER TFM E 
wd o <= wdi; 
wreg o C wreg i; 
case(aluop i) 
7'b0010011: begin 
case(alusel i) 
3'bil0: wdata o <= result; 
default: begin 
end 
endcase 
end 
default: begin 
wdata o 《= 0; 
end 
endcase 
end 
endmodule 


图 7-10 判断 写 回 部 分 代码 
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ex mem. v 模块 为 执行 与 访 存 阶段 之 间 的 寄存 器 , 它 将 执行 阶段 的 结果 储存 起 来 ,在 下 
一 个 时 钟 周 期 发 送 给 模块 。 其 结构 与 取 指 和 译 码 模块 的 寄存 器 结构 类 似 , 其 框图 及 代码 如 
图 7-11 所 示 。 

4. 访 存 模块 的 设计 

由 于 上 述 使 用 到 的 指令 并 没有 涉及 访问 存储 器 的 指令 ,所 以 在 此 模块 中 不 执行 任何 操 
作 , 数 据 通 过 访 存 模块 直接 送 到 回 写 模块 。 在 补充 指令 完成 RISC-V 处 理 器 时 , 当 涉 及 读 写 
存储 器 或 者 中 断 异常 时 将 会 对 访 存 模块 进行 相应 的 修改 。 访 存 模块 包含 mem. v 和 mem_ 
wb. v 两 个 文件 。mem. v 目前 只 设计 成 一 个 组 合 逻 辑 电 路 ,将 输入 的 数据 直接 输出 ,其 框图 
及 代码 如 图 7-12 所 示 。 


ex_mem0 


cik 
ex wdi4:0] 


mem wdl4:0] 
'ex wdata[31:0] mem wdata[31:0] 
ex wreg mem wreg 


rst n 


ex mem memo 
(a) ex_mem 模 块 框图 


module ex_mem( 


wd o[4:0] 
wdata o[31:0] 


input clk, wreg o 
input rst n, 
input [4:0] d IL 
input [4: ex wd, anas " 
x (a) 访 存 模块 框图 
input ex wreg, 
: . module nea 
input [31:0] ex wdata, ipit itm, 
output reg [4:0] mem wd, input [4:0] vd i, 
output reg mem wreg, eet mem cl 
t [31:0) vdata i, 
output reg [31:0] mem wdata TIN T 
) : output reg [4:0] vdo, 
output reg weg_o, 
always @ (posedge clk or negedge rst_n) begin output reg [31:0] viatao 


ifÜrst n) begin 


mem wd <= 0; always 8 (+) begin 


mem wreg <= 0; ifÜxst n) begin 
mem wdata <= 0; wa o; 
end wreg o C 0; 
$ wdata o <= 0; 
else begin 


end 


mem wd <= ex wd; else begin 


mem wreg <= ex wreg; wd o © wdi; 
mem wdata 《= ex wdata; wreg o 《= wreg i; 
wdata o <= wdata i; 
end 
end 
end ud 
endmodule endnodule 
(b) ex_mem 模 块 代码 (b) 访 存 模块 代码 


图 7-11 ex mem 模块 图 7-12 访 存 模块 
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mem wb. v 文件 与 之 前 各 模块 的 寄存 器 文件 类 似 , 都 是 将 本 阶段 的 数据 在 下 一 个 时 钟 
周期 发 送 到 下 一 模块 ,其 框图 及 代码 如 图 7-13 所 示 。 

5. 回 写 模 块 的 设计 

流水 线 最 后 是 将 上 述 指令 的 结果 写 回 寄 存 器 ,此 部 分 发 生 在 regfile 模块 ,将 mem. wb. 
v 的 输出 连接 到 regfile. v 模块 的 输入 完成 数据 的 写 回 。 各 个 输入 /输出 的 详细 连接 可 以 参 
考 regfile. v 和 顶层 模块 。 

6. 顶层 模块 的 设计 

顶层 模块 的 主要 目的 是 将 上 述 文件 中 的 输入 /输出 端口 进行 连接 和 例 化 ,将 上 述 各 个 模 
块 连接 成 一 个 完整 系统 。 顶 层 模 块 文件 为 risc. v 文件 。 下 面 为 顶层 模块 输入 /输出 定义 和 
部 分 信号 声明 ,其 框图 及 代码 如 图 7-14 所 示 。 


riscv0 
mem_wb0 
= 
cik rom addr o[31:0] 
wb. wd[4:O] rom data [31:0] rom ce o 
wb wdata[31:0] rei n 
EXE —— Mj 
E Tiscv 
mem ws (a) 顶层 模块 框图 
(a) mem_wb 模 块 框图 module riscv( 
nodule mem wb( input rst an 
input rst n, input clk, 
input clk, 
input [31:0] rom data i, 
input [4:0] men wd, output [31:0] rom addr o, 
input menm wreg, output rom ce o 
input [31:0] men wdata, ); 
output reg [4:0] wb wd, wire [31:0] pc; 
output reg wb wreg, wire [31:0] id pc i; 
output reg [31:0] wb wdata wire [91:0] id inst i; 
) 
wire [6:0] id aluop o; 
alvays @ (posedge clk or negedge rst n) begin wire [2:0] id alusel o; 
if(rst n) begin wire [31:0] id regl o; 
wb wd & 0; wire [31:0] id reg2 o; 
wb wreg 人 = 0; wire id wreg o; 
wb wdata <= 0; wire [4:0] id wd o; 
end 
else begin wire [6:0] ex aluop i; 
wb wd <= mem wd; wire [2:0] ex alusel i; 
wb wreg 《= mem wret; wire [31:0] ex xegl i; 
wb wdata 《= mem wdata; wire [31:0] ex xeg2 i; 
end wire ex wreg i; 
end wire [4:0] ex wd i; 
endnodule Re 
(b) mem_wb 模 块 代码 (b) 顶层 模块 代码 
图 7-13 mem_wb 模块 图 7-14 顶层 模块 


对 各 个 模块 例 化 ,将 它们 组 合成 系统 ,如 图 7-15 所 示 。 
到 此 针对 ori 指令 的 5 级 流水 线 设计 已 经 完成 了 .后续 内 容 会 继续 补充 其 内 容 , 实 现 更 
多 的 功能 。 
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7. 指令 存储 器 ROM 的 设计 

由 于 本 处 理 器 采用 哈佛 结构 , 即 指令 与 数据 单独 存储 ,如 果 想 让 处 理 器 进行 功能 验证 必 
须 添加 对 应 的 指令 存储 器 ,CPU 将 从 指令 存储 器 中 取出 指令 。 下 面 介 绍 对 于 指令 存储 器 
ROM 的 设计 ,其 框图 及 代码 如 图 7-16 所 示 。 


pc reg pc regO( 
«elk (cl), 
rst n(rst n), 


»pe(pc), 


t : inst romO 
.ce(xon ce. o 
) 
; addr[31:0] inst[31:0] 
assign rom addr o = pc; LP 
ce 
if id if id0( inst rom 
FIF (a) 存储 器 模块 框图 
.rst_n(rst_n), 
if. pe (pc) module inst rom( 
.证 inst(rom data i), input ee 
«id pc(id pc i) input [31:0] addr, 


output reg [31:0] inst 
); 


-id inst(id inst i) 

ME 

regfile regfileO( 
:clk(clk), 
.rst_n(rst_n), 
.we(wb_wreg_i), 
.waddr(wb wd i), 
.wdata(wb wdata i), 
»rel(regl read), 
-raddrlí(regl addr), 
-rdatal(regl data), 


reg [31:0] inst mem [0:255]; 


initial $readmemh (^inst rom.data^, inst men); 


always @ (+) begin 
if (“ce) 
inst € 0; 
else 


re2(reg2. read) inst 《= inst men[addr[9:2]]; 


.raddr2(reg2 adár), ed 
.rdata2(reg? data) edant 
); (b) 存储 器 模块 代码 
图 7-15 各 模块 例 化 图 7-16 存储 器 模块 


设计 中 使 用 到 了 initial 语句 ,initial 语句 只 执行 一 次 ,一 般 只 用 于 仿真 ,不 能 被 综合 。 
函数 $ readmemh 是 一 条 系统 函数 , 它 可 以 用 来 读 取 文 件 , 但 要 保证 文件 中 的 指令 为 十 六 进 
制 。inst_rom. data 文件 中 存储 着 测试 CPU 所 要 用 到 的 32 位 指令 ,通过 $readmemh 函数 
可 以 将 文件 中 的 指令 读 取 到 inst mem 数组 中 。 

由 于 设计 中 采用 字 节 寻 址 ,所 以 每 一 条 32 位 指令 地 址 都 要 占用 4 个 地 址 位 ,指令 地 址 
都 要 为 4 的 倍数 ,可 以 将 指令 地 址 左 移 两 位 来 保证 地 址 的 正确 性 。 

8. 最 小 系统 的 设计 

该 模块 是 将 指令 存储 器 ROM 与 之 前 所 设计 的 CPU 进行 连接 构成 一 个 CPU 的 最 小 系 
统 。 其 设计 方法 与 之 前 CPU 顶层 模块 的 设计 方法 相似 ,要 将 两 个 模块 进行 连 线 和 例 化 。 
当 CPU 最 小 系统 运行 时 CPU 模块 会 将 地 址 发 送 到 指令 存储 器 ROM 中 ,指令 存储 器 将 所 
对 应 的 指令 读 取 到 CPU 中 供 CPU 流水 线 进行 执行 ,其 框图 及 代码 如 图 7-17 所 示 。 

9. 测试 程序 编写 

如 果 想 要 对 CPU 最 小 系统 进行 仿真 验证 ,还 需要 对 指令 存储 器 中 提 到 的 inst_rom. 
data 进行 编辑 和 编写 CPU 测试 文件 。 对 于 目前 单条 指令 的 测试 指令 ,读者 可 以 使 用 配套 
源 代码 指定 目录 中 的 文件 进行 测试 ,也 可 以 根据 RISC-V 指令 集 自行 编写 测试 指令 。 下 面 
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inst_rom0 


clk 
cik 


rom data i[31:0] 


rst n 


[^ rstn | 


rom addr o[31:0] addr[31:0] 
rom ce o ce 


inst[31:0] 


inst rom 


F) 


riscv 
(2) 最 小 系统 框 
nodule RISCVtop( 
input clk, 


input rst_n 
E 
wire [31:0] inst adár; 
wire [31:0] inst; 
wire rom ce; 
riscv riscvO( 
clk (clk), 
,Tst_n(rst_n)， 
.xom addr o(inst addr), 
-rom data i(inst), 
.rom ce o(rom ce) 


); 


inst rom inst_ron0( 
«ce(ron ce), 
.addr (inst addr), 
. inst(inst) 

» 

endnodule 


(b) 最 小 系统 代码 
图 7-17 最 小 系统 


简单 介绍 一 下 测试 指令 编写 的 方法 ,如 表 7-4 所 示 。 


测试 指令 


表 7-4 编写 测试 指令 


ORI S1,S0,0x2 


imm[11:0] rsl 


110 rd 0010011 


000000000010 00000 


110 00001 0010011 


inst_rom. data 


00206093 


用 户 首先 设计 对 应 的 汇编 指令 ,根据 RISC-V 指令 集 的 编码 规则 将 汇编 指令 转换 成 相 
应 的 RISC-V 指令 形式 ,最 后 将 32 位 指令 转换 成 十 六 进 制 形式 写 入 inst rom. data 文件 中 。 
本 书 附带 的 测试 程序 为 如 下 几 条 指令 ,其 测试 文件 可 在 配套 源 代码 相应 目录 下 查看 。 


ORI  S1,S0,0x2 00206093 
ORI  S2,S0,0x3 00306113 
ORI  S3,S0,0x5 00506193 


测试 文件 的 编写 : 测试 模块 主要 将 时 钟 和 复位 信号 提供 给 CPU ,将 最 小 系统 与 测试 模 
块 进行 连接 ,并 观察 最 终 的 测试 波形 是 否 符合 之 前 的 设计 要 求 。 图 7-18 为 测试 模块 test. v 
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部 分 的 代码 。 

通过 Vivado 软件 自 带 的 仿真 工具 进行 仿真 ,观察 波形 验证 是 否 与 设计 思想 F 
测试 文件 中 只 有 ori 指令 运算 ,所 以 我 们 可 以 直接 观察 写 — PES Serial 
的 测试 结果 一 致 即 可 ,在 仿真 界面 添加 mem  r 信和 号 来 观察 最 终 的 结果 ,如 图 7-19 所 示 。 


module test( 
); 
reg clk; 


reg rst n; 


initial begin 
clk = 0 
rstn= 0; 
#100 
rst n= 1bl; 
end 


always #20 clk = “clk; 


RISCVtop RISCVtopO( 
- clk (clk), 
.rst n(rst n) 
); 


endnodule 


图 7-18 测试 模块 代码 图 7-19 单条 指令 仿真 结果 


从 图 7-19 中 可 以 发 现 上 述 3 条 测试 指令 的 运算 结果 全 部 正确 ,也 可 以 看 出 流水 线 将 结果 
逐条 写 回 寄 存 器 中 ,实现 了 流水 的 功能 。 到 目前 为 止 , 基 于 ori 指令 的 RISC-V 处 理 器 的 设计 
就 已 经 完全 结束 了 。 读 者 可 以 根据 RISC-V 指令 集 丰 富 该 款 CPU 让 其 实现 更 多 的 功能 。 

7.2.3 2 条 指令 的 RISC-V 处 理 器 设计 

完成 了 单条 指令 的 处 理 器 设计 后 .下面 在 该 设计 的 基础 上 添加 一 条 指令 ,扩充 流水 线 的 
功能 。 下 面 在 处 理 器 上 添加 addi 指令 。addi 指令 将 操作 数 寄存 器 rsl 中 的 整数 值 与 12 位 
立即 数 (进行 符号 位 扩展 ) 进 行 加 法 操作 ,结果 写 回 寄存 器 rd 中 。 

从 前 文 的 指令 介绍 中 可 以 发 现 ,addi 与 ori 指令 都 属于 I 类 型 的 32 位 指令 ,两 条 指令 的 
低 7 位 都 为 7?b0010011, 只 有 指令 的 第 12—14 位 稍 有 不 同 ,如 表 7-5 所 示 。 

表 7-5 2 条 指令 说 明 


指令 说 明 
ADDI imm[11:0] rsl 000 rd 0010011 
ORI imm[11:0] rsl 110 rd 0010011 


因此 大 多 数 模 块 不 需要 修改 ,只 要 修改 设计 的 译 码 和 执行 两 个 模块 ,在 这 两 个 模块 中 添 
加 addi 指令 相应 的 译 码 和 执行 代码 即 可 完成 addi 指令 的 功能 

1. 译 码 模 块 的 修改 

由 于 addi 指令 和 ori 指令 的 opl 部 分 相同 ,两 条 指令 都 要 写 回 目的 寄存 器 , 读 取 操作 数 
1 并 且 都 需要 立即 数 而 不 读 取 寄 存 器 2。 因 此 两 条 指令 的 译 码 方式 完全 一 致 ,所 以 添加 addi 
指令 的 第 12 一 14 位 到 ori 指令 的 译 码 方式 中 ,其 他 地 方 不 做 改变 ,修改 后 如 图 7-20 所 示 。 
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case (op) 
T b0010011: begin DERRE 
case (opl) 
3' b000, 3° b110: begin //addi, ori 
wreg o C l'bl; 
aluop o € op; 
alusel o <= opl; 
regl read o <= l'bl; 
reg2 read o <= l'b0; #2 
imm € ((20(inst 1[31])) , inst_i[31:20]}; /Xr BURGI E 
end 
default: begin 
end 
endcase 
end 


default: begin 
end 
endcase 


图 7-20 译 码 模块 修改 


2. 执行 模块 的 修改 
在 执行 模块 添加 addi 指令 的 执行 语句 ,由 于 它 与 ori 指令 的 运算 类 型 都 为 立即 数 运算 ， 
所 以 在 ori 指令 的 预算 类 型 中 添加 addi 的 执行 语句 ,如 图 7-21 所 示 。 


always @ (*) begin /通过 译 码 阶 卜 发 送 过 来 的 信息 确定 具体 的 运算 操作 
if(rst_n) 
result <= 0; 
else begin 
case(aluop i) 
T b0010011: begin 
case(alusel i) 
3'b000: result <= regl i + reg2 i;  // 热 行 相应 的 运算 
3'bll0: result < regl_i | reg2 i; 
default: begin 
result <= 0; 
end 
endcase 
end 
default: begin 
end 
endcase 
end 


end 


图 7-21 添加 执行 语句 


将 addi 指令 的 运算 结果 添加 到 与 ori 指令 相同 的 数据 输出 端口 ,如 图 7-22 所 示 。 

3. 测试 程序 编写 

修改 译 码 和 执行 模块 后 已 经 成 功 完成 了 addi 功能 的 添加 ,下 面 修改 测试 文件 以 验证 设 
计 的 正确 性 。 在 测试 文件 中 添加 一 条 addi 指令 ,读者 可 以 使 用 配套 源 代 码 指定 目录 中 的 文 
件 进行 测试 ,也 可 以 根据 上 文 提 到 的 测试 代码 编写 的 方法 自行 编写 测试 指令 。 本 书 附带 的 


always @ (*) begin 将 
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wd o “= wd i 
wreg o <= wreg i 
case(aluop i) 
7'b0010011: begin 
case(alusel i) 
3' b000, 3 b11 


default: begin 


<= result 


: wdata o 


end 
endcase 
end 


default: b 


wdata o 《= 0 
end 
endcase 


end 


图 7-22 添加 输出 


测试 程序 为 如 下 指令 ,本 测试 文件 可 在 配套 源 代码 相应 目录 下 查看 。addi 指令 的 测试 代码 


是 在 ori 指令 测试 代码 的 基础 上 添加 了 


ORI  S1,S0,0x2 
ORI  S2,S0,0x3 
ORI  S3,S0,0x5 
ADDI S4,S1,0x1 


从 图 7-23 中 可 以 发 现 上 述 测试 指令 的 运 


-条 addi 指令 来 验证 其 功能 。 


00206093 
00306113 
00506193 
00108213 


算 结 果 全 部 正确 ,由 图 也 可 以 看 出 流水 线 将 结 


果 逐 条 写 回 寄存 器 中 ,实现 了 流水 的 功能 。 到 目前 为 止 基 于 两 条 指令 的 RISC-V 处 理 器 的 
设计 就 已 经 完全 结束 了 ,读者 可 以 根据 RISC-V 指令 集 丰 富 该 款 CPU 让 其 实现 更 多 的 


功能 。 


两 条 指令 仿真 结果 


图 7-23 


7.2.4 3 条 指令 的 RISC-V 处 理 器 设计 


上 文 介绍 的 两 条 指令 都 属于 工 类 型 的 32 位 指令 ,如 果 添 加 其 他 类 型 的 指令 处 理 器 将 如 
何 修改 呢 ? 下 面 将 在 处 理 器 中 添加 一 条 R 类 型 的 32 位 指令 ,该 种 指令 的 低 7 位 都 为 
7'b0110011.R 指令 都 是 读 取 rsl 通用 寄存 器 中 的 数据 与 rs2 通用 寄存 器 中 的 数据 进行 相 
应 的 运算 ,最 后 将 运算 结果 保存 到 rd 寄存 器 中 。 表 7-6 为 ADDI 与 ADD 二 指令 的 说 明 。 
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表 7-6 ADDI 与 ADD 二 指令 的 说 明 


指令 说 明 
ADDI imm[11:0] rsl 000 rd 0010011 
ADD 0000000 rs2 rsl 000 rd 0110011 


通过 观察 发 现 R 类 型 的 add 指令 和 工 类 型 的 addi 指令 相 比 其 低 7 位 不 同 ,并 且 前 者 需 
要 读 取 寄存 器 2 的 数据 。 虽 然 相 比 7.2.3 节 两 条 指令 的 差异 有 所 增 大 ,但 通过 修改 译 码 模 


块 和 执行 模块 同样 可 以 实现 相应 的 功能 。 
1. 译 码 模块 的 修改 


由 于 add 指令 的 低 7 位 与 之 前 两 条 指令 的 低 7 位 不 同 ,所 以 在 译 码 阶 段 增加 针对 R 指 


令 类 型 的 译 码 方式 ,如 图 7-24 所 示 。 


case(op) 
T b0010011: begin TERRE 
case (opl) 
3' b000, 3 b110: begin 
wreg o 《= 1 bl; 
aluop o <= op; 
alusel o <= opl; 
regl read o <= l'bl; 
reg2 read o <= 1'b0; UAE 
imm <= {{20 {inst_i[31]}} , inst_i[31:20]}; 立即 数 扩展 
end 
default: begin 
end 
endcase 
end 
T b0110011: begin 运算 操作 
case(opl) 
3'b000: begin add 
wreg o <= l'bl; 
aluop o <= op; 
alusel o <= opl; 
regl read o < l'bi; 
reg? read o “= l'bi; 
end 
default: begin 
end 
endcase 
end 


图 7-24 增加 译 码 方式 


add 指令 与 前 文 的 两 条 I 类 型 指令 最 大 的 区 别 为 需要 读 取 操作 数 2, 所 以 读 操 作 数 2 的 


值 为 1, 并 且 不 需要 立即 数 。 
2. 执行 模块 的 修改 


与 addi 指令 添加 执行 语句 的 情况 类 似 .但 由 于 其 低 7 位 与 1 指令 不 同 ,所 以 单独 增加 R 


类 型 的 执行 语句 ,如 图 7-25 所 示 。 


将 add 指令 的 运算 结果 添加 到 数据 输出 端口 ,如 图 7-26 所 示 。 
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always @ (*) begin / BE SERIE ER RO VERRE BLUR 
ifÜrst m) 
result <= 0; 
else begin 
case(aluop i) 
T b0010011: begin 
case(alusel i) 
3'b000: result <= regl i + reg2 i; 
3'bil0: result <= regl i | reg2 i; 
default: begin 
result 《= 0; 
end 
endcase 
end 
T b0110011: begin 
case(alusel i) 
3 b000: result <= regl i + reg2 i; 
endcase 
end 
default: begin 
end 
endcase 
end 


end 


图 7-25 增加 执行 语句 
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ZAHER RIE 


always @ (*) begin IRER GRRR FMR 


wd o <= wd i; 
wreg o C wreg i; 
case (aluop i) 
T' b0010011: begin 
case(alusel i) 
3'b000, 3  b110: wdata o <= result; 
default: begin 
end 
endcase 
end 
7'b0110011: begin 
case(alusel i) 
3'b000: wdata o <= result; 
default: begin 
end 
endcase 
end 
default: begin 
wdata o <= 0; 
end 
endcase 


end 


图 7-26 增加 结果 输出 
3. 测试 程序 编写 


修改 译 码 和 执行 模块 后 已 经 成 功 完成 了 add 功能 的 添加 ， 
计 的 正确 性 。 在 测试 文件 中 添加 一 条 add 指令 ,读者 可 以 使 用 配套 源 代码 指定 目录 中 的 文 


下 面 修改 测试 文件 来 验证 设 
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件 进行 测试 ,也 可 以 根据 上 文 提 到 的 测试 代码 编写 的 方法 自行 编写 测试 指令 。 本 书 附 带 的 
测试 程序 为 如 下 指令 ,本 测试 文件 可 在 配套 源 代码 相应 目录 下 查看 。add 指令 的 测试 代码 
是 在 之 前 两 条 指令 测试 代码 的 基础 上 添加 了 一 条 add 指令 来 验证 其 功能 。 


ORI  S1,S0,0x2 00206093 
ORI  S2,S0,0x3 00306113 
ORI  S3,S0,0x5 00506193 
ADDI S4,S1,0x1 00108213 
ADD S5,S1,S2 002082b3 


从 图 7-27 中 可 以 发 现 上 述 测试 指令 的 运算 结果 全 部 正确 ,由 图 也 可 以 看 出 流水 线 将 结 
果 逐 条 写 回 寄存 器 中 ,实现 了 流水 的 功能 。 到 目前 为 止 基于 三 条 指令 的 RISC-V 处 理 器 的 设 
计 就 已 经 完全 结束 了 ,读者 可 以 根据 RISC-V 指令 集 丰 富 该 款 CPU 让 其 实现 更 多 的 功能 。 


| pms 


图 7-27 三 条 指令 仿真 结果 


7.2.5 10 条 指令 的 RISC-V 处 理 器 设计 


通过 上 两 节 对 于 添加 指令 的 介绍 ,相信 读者 对 于 指令 的 增加 有 了 一 定 的 了 解 。 下 面 来 
实现 10 条 指令 的 RISC-V 处 理 器 的 设计 .由 于 这 10 条 指令 都 为 1 类 型 或 R 类 型 的 指令 ,所 
以 添加 指令 时 只 需要 改变 译 码 模块 和 执行 模块 即 可 。 对 于 其 他 类 型 的 指令 读者 也 可 以 模仿 
添加 R 类 型 指令 时 的 修改 方法 自行 扩充 。 

10 条 指令 说 明 , 如 表 7-7 所 示 。 


表 7-7 10 条 指令 说 明 


指令 说 明 
ADDI imm[11:0] rsl 000 rd 0010011 
SLLI 0000000 shamt rsl 001 rd 0010011 
XORI imm[11:0] rsl 100 rd 0010011 
ORI imm[11:0] rsl 110 rd 0010011 
ANDI imm[11:0] rsl 111 rd 0010011 
ADD 0000000 rs2 rsl 000 rd 0110011 
SLL 0000000 rs2 rsl 001 rd 0110011 
XOR 0000000 rs2 rsl 100 rd 0110011 
OR 0000000 rs2 rsl 110 rd 0110011 
AND 0000000 rs2 rsl 111 rd 0110011 
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ER 10 条 指令 在 添加 时 都 遵循 之 前 两 节 的 指令 添加 方式 ,唯一 需要 注意 的 为 slli di 
令 。slli 指 令 对 操作 数 寄存 器 rsl 中 的 整数 值 进 行 逻 辑 左 移 ,其 移 位 量 是 5 位 立即 数 ,结果 
写 回 到 寄存 器 rd 中 。 因 此 slli 指令 的 立即 数 不 需 要 进行 符号 位 的 扩展 ,在 修改 译 码 模块 时 
要 对 它 单独 进行 添加 。 

1. 译 码 模 块 的 修改 

将 其 他 几 条 指令 的 第 12 一 14 位 添加 到 对 应 指令 类 型 中 。 由 于 slli 指令 的 立即 数 不 需 
要 进行 符号 位 的 扩展 所 以 单独 对 其 进行 译 码 ,如 图 7-28 所 示 。 


case (op) 
7 b0010011: begin /3E BURG 
case (opl) 

3' b000, 3 b100, 3 b110, 3 b111: begin //addi, xori, ori, andi 
wreg o 《= 1 bl; [AES BHRT 
aluop o <= op; d EARS 
alusel o <= opl; 运算 方式 
regl read o <= l'bi, / S WRERG 
reg? read o <= 1'b0; SARER 
imm <= {{20 {inst_i[31]}} ，inst_i[31:20]}; /立即 数 扩 展 

end 

3'b001: begin //slli 
wreg o <= 1 bl; /8 55 Bs 
aluop o <= op; ^ 
alusel o <= opl; 
regl read o < 1 bl; 
reg2 read o <= 1'b0; 

imm <= inst i[24:20]; BUE 

end 

default: begin 

end 

endcase 
end 


图 7-28 添加 slli 指令 


对 5 条 I 类 型 的 指令 添加 完成 后 ,继续 添加 R 类 型 指令 ,由 于 R 类 型 的 指令 基本 一 致 ， 
可 以 直接 添加 ,如 图 7-29 所 示 。 


Tb0110011: begin dE BRE 
case(opl) 
3' b000, 3’ b001, 3 b100, 3 b110, 3' bl11: begin //add, s11, xor, or, and 
wreg o C l'bl; 
aluop o 《= op; 
alusel o <= opl, 
regl read o <= l'bl; 
reg2 read o <= l'bl; 
end 
default: begin 
end 
endcase 
end 
default: begin 


end 


图 7-29 添加 R 类 型 指令 
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2. 执行 模块 的 修改 
执行 模块 的 修改 与 上 两 节 所 用 到 的 方法 基本 相同 ,将 相应 类 型 的 执行 语句 添加 到 对 应 
类 型 语句 中 ,如 图 7-30 所 示 。 


case(aluop_i) 
T b0010011: begin 
case(alusel i) 

3'b000: result <= regl i + reg2 i; // 执 行 相 / 
3'b001: result <= regl i << reg2 i; 
3'bl00: result <= regl i ^ reg2 i; 
3'bl10: result <= regl i | reg2 i; 
S'blil: result <= regl i & reg2 i; 
default: begin 


result <= 0; 
end 
endcase 
end 
T'b0110011: begin 
case(alusel i) 
3'b000: result 《= regl i + reg2 i; 
3'b001: result “= regl i << reg2 i; 
3'bl00: result <= regl i ^ reg2 i; 
3'bli0: result 《= regl i | reg2 i; 
S'blil: result <= regl i & reg2 i; 
endcase 
end 
default: begin 
end 
endcase 


图 7-30 ”执行 模块 修改 


3. 测试 程序 编写 

修改 译 码 和 执行 模块 后 已 经 成 功 完成 了 10 条 指令 的 添加 ,下 面 修改 测试 文件 来 验证 设 
计 的 正确 性 。 在 测试 文件 中 添加 指令 ,读者 可 以 使 用 配套 源 代 码 指定 目录 中 的 文件 进行 测 
试 ,也 可 以 根据 上 文 提 到 的 测试 代码 编写 的 方法 自行 编写 测试 指令 。 本 书 附带 的 测试 程序 
为 如 下 指令 ,本 测试 文件 可 在 配套 源 代 码 相应 目录 下 查看 。 增 加 指令 的 测试 代码 是 在 之 前 
三 条 指令 测试 代码 的 基础 上 添加 了 两 条 指令 来 验证 其 功能 。 


ORI  S1,S0,0x2 00206093 
ORI  S2,S0,0x3 00306113 
ORI  S3,S0,0x5 00506193 
ADDI S4,S1,0xl 00108213 
ADD  S5,S1,92 002082b3 
XOR  S6,S2,S3 00314333 
SLLI  S7,81,S82 00209393 
AND  S7,87,83 0033£3b3 


从 图 7-31 中 可 以 发 现 上 述 测试 指令 的 运算 结果 全 部 正确 ,由 图 也 可 以 看 出 流水 线 将 结 
果 逐 条 写 回 寄存 器 中 ,实现 了 流水 的 功能 。 到 目前 为 止 基于 10 条 指令 的 RISC-V 处 理 器 的 
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设计 就 已 经 完全 结束 了 ,读者 可 以 根据 RISC-V 指令 集 丰 富 该 款 CPU ,让 其 实现 更 多 的 
功能 。 


图 7-31 10 条 指令 仿真 结果 


7.3 ”开源 RISC-V 处 理 器 蜂鸟 E200 介绍 


蜂鸟 E200 系列 处 理 器 目标 是 打造 一 款 世 界 上 最 小 面积 与 最 高 能 效 比 的 RISC 处 理 器 。 
其 开源 代码 可 以 在 著名 开源 网 站 GitHub 上 搜索 “e200_opensource” 查 找到 ,蜂鸟 E200 系 
列 处 理 器 核 的 特性 简介 如 下 : 

(1) E200 系列 处 理 器 核 采 用 2 级 流水 线 结构 ,通过 一 流 的 处 理 器 架构 设计 ,该 CPU 核 
的 功 耗 与 面积 均 优 于 同 级 ARM Cortex-M0 十 核 ,实现 业界 最 高 的 能 效 比 与 最 低 的 成 本 。 

(2) E200 系列 处 理 器 核能 够 运行 RISC-V 48 4 4E. 支持 RV32I1/E/A/M/C/F/D 等 指 
令 子 集 的 配置 组 合 ,支持 机 器 模式 。 

(3) E200 系列 处 理 器 核 提 供 标准 的 JTAG 调试 接口 以 及 成 熟 的 软件 调试 工具 。 

(4) E200 系列 处 理 器 核 提供 成 熟 的 GCC 编译 工具 链 ,以 及 Linux 与 Windows 图 形 化 
软件 开发 工具 。 

(5) E200 系列 处 理 器 核 配套 SoC 提供 紧 耦 合 系统 IP 模块 ,包括 中 断 控制 器 .计时 器 、 
UART,QSPI,PWM 等 ,以 及 Ready-to-Use 的 SoC 平台 与 FPGA 原型 系统 。 

蜂鸟 E200 主要 面向 极 低 功 耗 与 极 小 面积 的 场景 ,目标 是 替代 传统 的 8051 内 核 或 者 
Cortex-M 系列 内 核 应 用 于 IoT 或 其 他 低 功 耗 场景 。 同 时 蜂鸟 E200 作为 结构 精简 的 处 理 
器 核 ,可 谓 “ 蜂 鸟 虽 小 、 五 脏 俱 全 ”。 源 代码 全 部 开源 公文 档 翔 实 ,适合 作为 在 校 师 生 学 习 
RISC-V 处 理 器 设计 (使 用 Verilog 语言 ) 的 教学 实验 或 自学 案例 。 蜂 鸟 E200 系列 处 理 器 的 
系统 示意 图 如 图 7-32 所 示 。 

K 7-8 所 列 , 蜂 鸟 E203 核心 的 功 耗 面积 和 性 能 均 优 于 ARM 的 Cortex-M0 十 处 理 器 核 
(M0 十 是 ARM 最 小 面积 的 处 理 器 核心 ); 蜂鸟 E205 核心 的 功 耗 面积 和 性 能 均 优 于 
Cortex-M3 处 理 器 核 。 而 E205fd 更 提供 了 目前 仅 在 Cortex-M7 中 才 具 备 的 双 精 度 浮 点 特 
性 (Cortex-M7 是 面积 特别 大 的 处 理 器 核 , 难 以 适应 极 低 功 耗 要 求 的 场景 ) 。 
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| DEMAS | 
m | 
中 断 接口 调试 接口 
“蜂鸟 "E200 系 列 处 理 器 核 
ITCM DTCM 
私有 外 设 ITCM 外 部 | DTCM 外 部 “| 系统 总 线 快速 IO 
接口 接口 接口 接口 接口 
外 部 设备 ! 
总 线 < RH > 快速 Io 模块 
外 外 外 dL -— uae 
设 | | 设 | | 设 j E TOME 1 
SEINE DNI: M 
' 
E 7-32 蜂鸟 E200 处理 器 系统 示意 图 
表 7-8 处理 器 参数 对 比 
"ET ARM ARM ARM 蜂鸟 | 蜂鸟 | 蜂鸟 
Cortex-MO | Cortex-MO-- | Cortex-M3 | E201 | E203 | E205 
0. 84 0.94 
(官方 ) (官方 ) 
Dhrystone 
放出 1.21 1.31 1.25 1.171 | 1.262 | 1.355 
` (经 选项 最 大 | (经 选项 最 大 
优化 后 的 数据 ) | 优化 后 的 数据 ) 
CoreMark 
2.33 2.42 3.32 1.352 | 2.226 | 3.327 
/ (CoreMark/ MHz) 
RORE STOA 12000 12000 36000 10000 | 12000 | 20000 
[TH 
E 180nm SLMC 工艺 下 
ai TW 50—100MHz 
流水 线 深 度 3 2 3 2 2 2 
乘法 器 有 有 有 无 有 有 
除法 器 无 无 有 无 有 有 
提供 32 位 提供 64 位 的 专用 
ITCM( 指 令 紧 耦合 存储 ) 不 提供 专用 ITCM 与 的 专用 ITCM 接口 
DTCM( 数 据 紧 耦 全 存储) DTCM 接口 ITCM 与 提供 32 位 的 专用 
DTCM 接口 DTCM 接口 
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续 表 
项 B ARM ARM ARM 蜂鸟 蜂鸟 | 蜂鸟 
Cortex-MO | CortexM0 十 | Cortex-M3 E201 | E203 | E205 
vs : uris 使 用 ECC 保护 
ECC 保护 SRAM 不 提供 ECC 保护 的 Memory ITCM 和 DTCM 
à " 可 以 进行 指令 集 扩 展 
可 扩展 性 不 支持 指令 集 扩 展 (支持 协 处 理 器 接口 ) 


i. 

(1) Cortex-M0 十 的 乘法 器 可 以 配置 成 单 周期 乘法 器 或 多 周期 迭代 乘法 器 ,因此 其 Dhrystone 性 能 数据 有 两 组 ; 
CoreMark 性 能 数据 采用 单 周 期 乘法 或 多 周期 乘法 器 信息 不 详 。 

(2) 本 表格 中 有 关 ARM-Cortex-M 系列 处 理 器 核 的 性 能 数据 来 自 其 他 公开 信息 , 非 官方 数据 。 请 以 ARM 最 新 官方 
数据 为 准 。 


很 多 开源 处 理 器 核 仅 有 内 核 的 实现 。 在 这 种 情况 下 为 了 使 其 能 够 被 完整 使 用 起 来 ,用 
户 需 要 花费 不 少 精 力 来 构建 完整 的 SoC 平台 、FPGA 平台 ,并 且 调 试 的 支持 难度 很 大 。 蜂 
鸟 E200 不 仅 设 计 完 成 了 内 核 的 实现 ,还 搭配 完整 的 SoC 平台 ,如 图 7-33 所 示 。 


其 他 系统 
主 域 协 处 理 器 人 ”设备 接口 
外 部 DTCM 接 口 T =| PWMO 
lj 一 上 | DTCM EAI 协 处 理 器 接口 IL. Iw 
hs SETGNÉ E200 系 列 处 理 器 核 wa 
à ae PRCI 
M M ] [M] [M MHES 
| i E am [UARTO] 
快速 PLIC | |CLINT & UART] 
IO 接口 I--| QSPII 
i 系统 存储 总 线 LL l'aspiz 
! i =| GPIO 
OTP QSPI- | 其 他 系统 [æ OTP 
Flash | 存储 接 
MROM| | 存储 读 cam 存储 接 [ |a OSPIO 


| 


Debug 


TJAG 接 口 一 一 一 一 一 | 模块 


图 7-33 E200 系列 处 理 器 配套 的 SoC 


蜂鸟 E200 系列 中 ,目前 开源 的 具体 型 号 为 蜂鸟 E203 处 理 器 核 。 蜂 鸟 E200 系列 中 的 
每 款 处 理 器 均 有 一 定 的 可 配置 性 。 以 开源 的 蜂鸟 E203 核 为 例 ,通过 修改 其 目录 下 的 
config. v 文件 中 的 宏 定义 便 可 以 实现 不 同 的 配置 。config. v 文件 在 e200_opensource 目录 
的 结构 如 图 7-34 所 示 。 


e200_opensource 
|----rti // 存放 RTL 的 目录 
1----e203 // E203 M soc 的 RTL 目录 
1----core // 存放 core 相关 模块 的 RTL 代码 
|----config.v // 设 定 配置 的 源 文件 


图 7-34 config 文件 目录 
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7.4 基于 开源 项 目的 CPU 综合 实验 


如 前 所 述 , 开 源 开 放 是 信息 技术 发 展 的 趋势 。 高 校 培养 的 学 生 也 应 该 尽早 地 学 习 如 何 
合理 地 利用 开源 项 目 完成 开发 需求 ,并 基于 开源 项 目 做 更 多 的 创新 工作 ,而 不 是 每 次 都 从 零 
开始 重复 地 造 轮子 。 通 过 引入 开源 项 目 ,还 可 以 让 学 生 有 机 会 学 习 来 自 工 业界 工程 师 们 的 
代码 设计 ,学 习 其 设计 风格 和 思想 。 正 如 目前 的 操作 系统 实验 , 常 采用 把 Linux 或 wC/OS- 
下 等 开源 操作 系统 内 核 中 某 些 功能 和 代码 片段 拿 掉 , 让 学 生 填 补 起 来 的 方式 ,使 学 生 掌握 操 
作 系统 的 设计 原理 ,而 不 是 都 从 零 开始 写 一 个 自己 的 操作 系统 。 在 指令 集 开 源 的 大 背景 下 ， 
组 成 原理 的 实验 也 完全 可 以 借鉴 这 样 的 方法 ,在 开源 项 目的 基础 上 通过 合理 的 设计 ,使 学 生 
达到 学 习 目标 。 本 书 认为 ,基于 蜂鸟 E200 RISC-V 开源 处 理 器 项 目 ,至 少 可 以 设计 出 如 下 
三 种 不 同 的 实验 方式 。 


7.4.1 从 完整 soc 项 目 中 抽取 出 CPU 内 核 上 板 验证 


蜂鸟 E200 开源 项 目 提供 了 完整 的 SoC 实现 ,并 可 在 Arty 开发 板 上 运行 。 但 如 果 要 在 
其 他 开发 板 上 运行 ,还 需要 一 定 的 移植 工作 。 此 外 ,如 果 对 于 组 成 原理 所 需 单纯 的 CPU 实 
验 , 则 需要 从 完整 SoC 项 目 中 提取 出 CPU 内 核 。 项 目 本 身 为 内 核 部 分 提供 了 仿真 验证 ,但 
如 果 要 在 本 书 所 用 的 PYNQ 板 卡 上 或 其 他 FPGA 平台 上 进行 内 核 的 调试 ,还 需要 能 够 理 
解 代 码 并 对 其 进行 相应 的 输入 /输出 工作 。 

因此 ,如 果 基 于 蜂鸟 E200 开源 项 目 进行 CPU 实验 ,可 以 将 开源 网 站 及 开源 项 目 发 布 
给 学 生 , 同 时 指定 在 PYNQ 上 对 其 提取 出 的 内 核 进行 验证 的 接口 和 指令 。 学 生 可 以 在 理解 
开源 项 目的 基础 上 完成 内 核 的 移植 和 验证 。 

该 实验 要 求学 生理 解 开源 项 目的 代码 并 对 其 进行 修改 和 验证 ,具备 一 定 的 难度 ,适合 作 
为 集中 性 实践 环节 的 实验 任务 。 


7.4.2 ” 删 减 掉 特定 的 部 分 并 补 全 


第 二 种 实验 方式 可 以 通过 把 完整 的 CPU 内 核 的 特定 部 分 删 减 掉 并 让 学 生 对 其 进行 补 
全 。 该 实验 提供 一 个 不 完整 的 蜂鸟 E203 处 理 器 项 目 ,缺少 的 部 分 都 位 于 E203 处 理 器 的 流 
水 线 第 2 级 一 一 执行 阶段 ,该 阶段 缺少 部 分 指令 的 译 码 和 执行 。 学 生 需 要 将 蜂鸟 E203 的 
内 核 中 缺少 的 部 分 补充 完整 ,使 E203 处 理 器 能 正常 运行 ,通过 仿真 方式 对 处 理 器 进行 功能 
验证 。 

1. 仿真 测试 要 求 

在 测试 程序 中 写 入 任意 5 个 数 , 找 出 大 于 10 的 数 并 将 其 个 数 写 回 寄存 器 1 中 , 找 出 小 
于 10 的 数 并 其 个 数 写 回 寄 存 器 2 中 ,通过 仿真 结果 观察 处 理 器 能 否 正常 工作 。 

2. 仿真 测试 流程 

首先 将 处 理 器 补充 完整 ,可 以 先 以 汇编 指令 形式 编写 指令 测试 代码 ,再 将 汇编 指令 转换 
成 RISC-V 指令 形式 。 将 编写 好 的 指令 逐条 写 入 到 处 理 器 的 指令 存储 器 中 。 对 项 目 编写 
Testbench 文件 添加 时 钟 激励 以 运行 处 理 器 ,观察 测试 结果 是 否 正 确 。 
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7.4.3 扩展 开源 处 理 器 的 流水 线 级 数 


开源 的 蜂鸟 E203 处 理 器 为 两 级 流水 线 结构 ,因此 可 以 要 求学 生 在 理解 开源 代码 及 流 
水 线 原理 的 基础 上 对 蜂鸟 E203 处 理 器 的 流水 线 进行 扩展 ,如 将 两 级 流水 线 扩展 为 3 级 流 
水 线 。 观 察 修改 后 的 仿真 波形 与 2 级 流水 线 进行 对 比 ,观察 其 结果 是 否 一 致 ,运算 速度 是 否 
发 生变 化 。 该 实验 也 具备 一 定 的 难度 ,适合 作为 集中 性 实践 环节 的 实验 任务 。 


7.4.4 ”优秀 工作 的 六 选 方法 


对 于 综合 性 的 组 成 原理 实验 ,由 于 通常 具有 一 定 的 难度 ,学 生 很 难 在 规定 的 时 间 内 在 课 
内 完成 并 进行 演示 ,大 量 的 工作 需要 在 课外 完成 。 因 此 使 用 线 上 平台 在 课外 进行 实验 就 显 
得 比较 重要 。 但 是 ,学 生 在 课外 进行 实验 会 带 来 评价 上 的 难度 。 教 师 无 法 判断 学 生 提 交 的 
工作 是 自己 独立 完成 ,与 其 他 同学 讨论 后 完成 ,还 是 单纯 地 借鉴 了 同学 的 工作 。 即 使 通过 源 
代码 的 查看 也 难以 判断 ,因为 本 身 就 是 基于 开源 项 目 做 的 。 

因此 本 书 建议 可 通过 几 个 阶段 和 方法 进行 评价 。 当 然 ,由 于 水 平和 思路 所 限 ,不 见得 是 
最 佳 的 方式 , 仅 希 望 起 到 抛砖引玉 的 作用 。 

1. 通过 性 测试 

通过 性 测试 即 验证 学 生 提 交 的 实验 ,功能 是 否 正确 ,完成 程度 怎么 样 。 测 试 有 几 种 不 同 
的 方式 : 对 于 学 生 提 交 的 实验 结果 ,教师 可 通过 提供 标准 的 Testbench 对 其 进行 仿真 验证 ， 
但 这 是 一 个 极其 耗 时 的 过 程 。 目 前 同济 大 学 的 组 成 原理 相关 实验 采用 用 了 这 种 方式 ,通过 
在 后 台 服 务 器 运行 仿真 程序 完成 。 此 外 ,对 于 基于 本 书 所 介绍 的 PYNQ 平台 的 实验 ,教师 
完全 可 编写 Python 代码 对 学 生 的 比特 流 进 行 测试 ,这 样 的 测试 是 针对 真实 运行 的 系统 ,更 
具备 准确 性 。 当 然 ,无 论 采 用 哪 种 方式 ,对 学 生 的 实验 进行 一 一 测试 ,都 是 耗 时 耗 力 的 工作 。 
最 好 的 方式 是 有 自动 评测 的 方法 ,通过 对 学 生 提 交 作 业 的 自动 的 评测 ,可 以 将 教师 从 琐碎 的 
重复 性 工作 中 解放 出 来 。 自 动 评测 的 功能 可 能 需要 在 线 上 平台 支持 下 才能 实现 ,因为 其 可 
以 提供 管理 功能 。 有 兴趣 的 读者 可 以 关注 这 方面 的 发 展 。 

2. 实验 报告 评阅 

在 提交 的 实验 通过 性 检测 的 基础 上 ,已 经 可 以 对 学 生 的 完成 程度 有 基本 的 了 解 。 在 此 
基础 上 可 以 进一步 阅读 学 生 的 实验 报告 ,主要 是 了 解 学 生 对 所 做 实验 的 理解 和 认识 。 因 为 
虽然 完成 同样 的 实验 ,但 不 同 的 同学 通过 实践 之 后 对 理论 知识 的 理解 和 对 整个 事情 的 认识 
差异 程度 还 是 很 大 的 。 这 个 可 以 通过 实验 报告 的 评阅 得 以 了 解 。 

3. 优秀 作品 答辩 与 展示 

经 过 前 面 两 步 ,已 经 可 以 对 学 生 的 完成 程度 有 较 好 的 认识 。 但 如 果 要 进一步 从 中 选 出 
优秀 的 作品 ,可 以 采用 答辩 的 方式 。 如 果 全 员 答 辩 有 困难 ,可 以 鼓励 同学 们 进行 答辩 申请 ， 
只 有 参加 答辩 的 同学 才 有 可 能 获得 优秀 。 通 常 来 说 ,确实 只 有 实验 完成 好 、 理 解 透彻 的 同学 
才 会 申请 答辩 。 以 此 可 以 区 分 是 独立 完成 还 是 在 他 人 的 帮助 下 才 完 成 的 。 同 时 ,学 生 的 表 
达 和 沟通 能 力也 是 工程 教育 中 对 培养 学 生 的 要 求 。 


第 8 章 


CHAPTER 8 


本 章 给 出 了 基于 PYNQ 的 计算 机 组 成 原理 实验 的 参考 内 容 安排 。 考 虑 到 不 同学 校 的 
实际 情况 ,为 便于 直接 选取 到 合适 的 实验 内 容 , 本 书 给 出 了 基于 原理 图 和 基于 HDL 的 两 种 
方式 ,同时 提供 了 从 基本 的 数字 逻辑 到 综合 性 的 组 成 原理 实验 的 具有 一 定 跨度 的 参考 实验 
内 容 。 当 然 ,本 书 给 出 的 实验 内 容 仅 作为 参考 ,读者 完全 可 在 前 面 介 绍 的 工具 和 方法 的 基础 
上 ,灵活 安排 适合 自己 的 实验 内 容 。 

为 了 方便 进行 实验 , 书 中 提供 了 一 个 连接 完成 的 AxiGPIO 交互 模块 ,用 户 只 需要 通过 
Vivado 的 tcl 指令 调用 该 AxiGPIO 交互 模块 的 tcl 文件 就 可 以 直接 使 用 。 具 体 资料 请 见 源 
代码 的 对 应 目录 。AxiGPIO 交互 模块 包含 ZYNQ 芯片 IP、 系 统 复位 IP、Axi HU IP X 10 
个 AxiGPIO 模块 这 几 部 分 ,其 原理 如 图 8-1 所 示 。 
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图 8-1 AxiGPIO 交互 模块 原理 
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AxiGPIO 模块 建立 了 ARM 芯片 与 AxiGPIO 的 连接 ,用 户 可 以 参考 章 AxiGPIO 
使 用 部 分 的 内 容 , 将 自己 设计 的 模块 引 脚 与 AxiGPIO 模块 进行 连接 ,以 便 和 运行 在 PS 端 
的 Python 代码 交互 ,从 而 完成 整个 工程 的 设计 。 


8.1 基于 原理 图 的 实验 


采用 原理 图 的 方式 进行 组 成 原理 的 实验 ,其 优点 是 比较 直观 ,易于 理解 硬件 的 连接 方 
式 , 方 便 形 成 硬件 思维 ,而且 不 需要 进行 专门 的 学 习 。 原 理 图 的 方式 比较 适用 于 初学 者 ,可 
帮助 他 们 更 好 地 理解 硬件 。 同 时 对 数字 逻辑 及 组 成 原理 部 件 实验 等 复杂 程度 不 是 很 高 的 系 
统 , 设 计 效 率 也 比较 高 。 对 于 之 前 没有 FPGA 开发 基础 的 学 校 来 说 , 先 以 原理 图 方式 开始 ， 
不 失 为 一 种 比较 平缓 的 切入 方式 。 

但 原理 图 方式 的 缺陷 是 : 原理 图 仅 描 述 的 是 硬件 的 结构 ,而 对 于 构成 的 硬件 的 行为 并 
不 进行 直接 的 展示 。 另 外 ,对 于 复杂 程度 较 高 的 综合 性 组 成 原理 实验 ,如 完整 的 CPU 的 设 
计 , 采 用 原理 图 开发 时 效率 就 会 大 幅 下 降 。 而 硬件 描述 语言 Verilog/VHDL 与 原理 图 恰好 
相反 ,其 对 于 初学 者 来 说 具有 较 高 的 门槛 ,需要 有 一 定 的 学 习 成 本 。 并 且 对 于 没有 硬件 思维 
的 用 户 ,容易 将 其 与 软件 编程 混为一谈 ,描述 出 不 能 综合 的 电路 系统 。 但 其 优点 是 : 适合 于 
描述 复杂 的 硬件 系统 ,对 于 熟练 掌握 者 ,通过 代码 复 用 等 方法 也 可 以 具有 很 高 的 开发 效率 。 
同时 ,HDL 可 以 进行 硬件 的 行为 描述 ,方便 读者 理解 硬件 的 功能 。 

因此 ,本 节 所 设计 的 基于 原理 图 的 实验 具体 开展 方式 如 下 : 

实验 指导 书 中 以 Verilog HDL WART C v 文件 ) 的 方式 为 学 生 提供 每 个 实验 所 需 的 基 
础 模块 。 学 生 在 开展 实验 时 需要 根据 第 4 章 所 介绍 的 方法 自行 把 HDL 源 文件 生成 原理 图 
的 方式 供 实验 用 。 使 用 这 些 基 础 模块 ,再 用 原理 图 的 方式 完成 整个 实验 。 

以 此 方式 ,学 生 可 以 以 原理 图 的 方式 完成 整体 硬件 系统 的 搭建 ,同时 可 以 通过 参考 
HDL 源 代码 的 方式 更 好 地 理解 每 个 基础 模块 的 行为 和 功能 。 


8.1.1 全 加 器 


1. 实验 目的 

掌握 基于 PYNQ 平 台 及 Vivado 工具 的 组 合 逻辑 电路 的 开发 流程 及 调试 方式 。 了 解 1 
位 全 加 器 的 基本 构成 和 工作 原理 ,能 够 在 1 位 全 加 器 基础 上 搭建 多 位 全 加 器 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 ?所 提供 的 “. v” 源 文件 生成 IP, 并 采用 原理 
图 的 方式 调用 所 生成 的 IP 设计 所 要 求 的 系统 。 采 用 Vivado 进行 仿真 ,并 进行 7O 的 连接 ， 
最 后 生成 流 文件 ,并 下 板 完 成 验证 。 

3. 实验 说 明 

1) 实验 原理 

一 位 全 加 器 的 原理 图 .逻辑 表达 式 及 对 应 的 真 值 表 如 图 8-2 所 示 。 可 以 先 完 成 一 位 全 
加 器 的 实验 ,再 视 情况 完成 n 位 全 加 器 的 设计 实验 ,如 图 8-3 所 示 。 其 中 FA 代表 图 8-2 中 
的 一 位 全 加 器 。 
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输入 输出 
A | Bi | Ci | Si |Ca 
0|olololon 
Cii 0|0|1|1]| o 
0|1]0|1]| o 
0|1]|1[0]| ! 
1]0]0|1]| o 
ijol apo] ! 
SP 5 
SF=Ai@Bi@Ci 1|]i]e|0o| t 
| Cii=AiBi+AiCi+HBiCi ri 
C, AB, =AiBi+(Ai@Bi)Ci 
(a) 原理 图 (b) 逻辑 表达 式 (c) 真 值 表 


图 8-2 一 位 全 加 器 
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图 8-3. n 位 行 波 进 位 加 减法 器 


2) Python 交互 模板 
CD 加 载 比特 流 ( 一 位 加 法 器 的 Python 交互 模板 ) 的 代码 : 


from pynq import Overlay 
from pynq. lib import AxiGPIO 
overlay = Overlay(^/home/xilinx/jupyter notebooks/.... bit") "bit HRE 


(2) GPIO 口 的 命名 要 与 原理 图 的 连接 一 致 。 代 码 如 下 : 


gpio_0 = overlay.ip dict[ axi gpio 0'] 
gpio Ci = AxiGPIO(gpio 0). channell 
goio Ai = AxiGPIO(gpio 0). channe12 
gpio l = overlay.ip dict['axi gpio 1'] 
gpio Bi = AxiGPIO(gpio 1).channell 
gpio_5 = overlay.ip dicti axi gpio 5] 
gnio Cil = AxiGPIO(gpio 5). channell 
gpnio Si = AxiGPlO(gpio 5). channe12 


C3) 加 法 器 功能 验证 (GPIO 口 的 读 写 ) 的 代码 : 


Ë SGPIOREEURUR A RCIBULBESUTESS, Mepio CIH, A EEUTERTZZEBIBEODT 
mask = Obl 

gpio Ci. write(0bl mask) 

gpio Ai.write(0bl, mask) 
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gpio Bi. write(0b1, mask) 
Cil-goio Cil.read() 
Si-gpio Si.read() 
print(bin(Cil)) 
print(bin(Si)) 
3) 源 代 码 
本 书 配套 源 代 码 中 ,为 实验 提供 了 如 下 材料 
(1)“ 基 础 模块 "文件 夹 : 该 文件 夹 下 提供 的 是 每 个 实验 所 需 的 基础 模块 . v 源 文件 ,在 
采用 原理 图 方式 进行 实验 时 ,用 户 可 以 将 其 生成 IP 备用。 
(2) "test, v"; 是 对 用 户 完 成 的 设计 进行 仿真 时 所 需 的 Testbench 示例 程序 ,用 户 可 直 
接 使 用 ,也 可 以 根据 需要 自行 修改 。 
(3)“xxx. ipynb” 是 本 节 “Python 交互 模板 ”部 分 所 介绍 的 Python 源 文 件 。 
4. 实验 步骤 
CD 将 本 实验 对 应 源 代码 中 提供 的 基本 模块 的 . v 文件 生成 原理 图 。 
(2) 将 基础 模块 进行 连接 ,并 使 用 本 实验 对 应 源 代码 中 的 仿真 文件 进行 仿真 。 
O) 1/O 处 理 ,将 系统 的 逻辑 L/O 与 PS 相连 接 , 以 便 进行 调试 。 
(4) 重新 综合 .实现 及 生成 比特 流 文件 ,并 将 比特 流 文件 及 对 应 的 cel 文件 上 传 到 所 用 
PYNQ 节点 。 
(5) 下 板 实验 ,使 用 本 实验 对 应 源 代码 中 的 Python 调试 文件 ,观察 真实 运行 后 的 系统 
是 否 正常 工作 。 


8.1.2 译 码 器 


1. 实验 目的 

掌握 基于 PYNQ 平台 及 Vivado 工具 的 组 合 逻辑 电路 的 开发 流程 及 调试 方式 。 了 解 
二 一 四 译 码 器 的 基本 构成 和 工作 原理 ,并 在 此 基础 上 实现 三 一 八 译 码 器 。 

2. 实验 要 求 

要 求 采用 源 代 码 中 对 应 目录 下 的 “基础 模块 ?所 提供 的 “. v” 源 文件 生成 IP, 并 采用 原理 
图 的 方式 调用 所 生成 的 IP 设计 所 要 求 的 系统 。 采 用 Vivado 进行 仿真 ,并 进行 IO 的 连接 ， 
最 后 生成 比特 流 文件 ,并 下 板 完 成 验证 。 

3. 实验 说 明 

1) 实验 原理 

二 一 四 译 码 器 的 原理 图 及 对 应 的 真 值 表 如 图 8-4 所 示 。Y3、Y2、Y1 和 YO 为 译 码 器 输 
Um. E 为 使 能 端 , 低 电 平 有 效 。 当 E=0 时 ,允许 译 码 器 工作 ,Y3、Y2、Y1、Y0 中 仅 有 一 个 
为 低 电 平 输出 。 

基于 二 一 四 译 码 器 的 基本 构成 和 工作 原理 ,完成 三 一 八 译 码 器 实验 。 三 一 八 译 码 器 的 
真 值 表 如 图 8-5 所 示 。 
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xU 输 入 输 出 
E EL E [A|B|vol|vi|va|vs 
D vi ix[x[ 1|] i]i 
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3 [olilofifiloli 
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(a) 原理 图 (b) 真 值 表 
图 8-4 二 一 四 译 码 器 
输入 输出 
E[|A|S5]c.]|rvrv [v] |» | v | vs | Ye | v 
1 x [xc x 1 1 1 1 1 1 1 1 
0 D 0 0 0 1 1 1 1 1 1 1 
0 0 0 1 1 0 1 1 1 1 1 1 
0 D 1 0 1 1 0 1 1 1 1 1 
0 0 1 1 1 1 1 0 1 1 1 1 
0 1 0 0 1 1 1 1 0 1 1 I 
0 1 0 1 1 1 1 1 1 0 1 1 
0 1 1 0 1 1 1 1 1 1 0 1 
0 1 1 1 1 1 1 1 1 1 1 0 
图 8-5 三 一 八 译 码 器 真 值 表 


2) Python 交互 模板 


CD 加 载 比特 流 ( 二 一 四 译 码 器 的 Python 交互 模板 ) 的 代码 : 


from pynq import Overlay 
from pynq. lib import AxiGPIO 


overlay = Overlay(”/home/xilinx/jupyter_notebooks/.... bit”) 


(2) GPIO 口 的 命名 要 与 原理 图 的 连接 一 致 ,代码 如 下 : 


gpio_0 = overlay. ip_dict[ axi gpio 0'] 
gpio_E = AxiGPIO(gpio 0). chamell 
gpio A = AxiGPIO (gpio 0).channel2 
gpio_l = overlay. ip_dict[ axi gpio l'] 
gpio_B = AxiGPIO(gpio 1).channell 
gpio_5 = overlay. ip_dict[ axi gpio 5'] 
gnio YO = AxiGPIO(gpio 5). channell 
gio Yl = AxiGPIO(gpio 5). channe12 
gpio.6 = overlay.ip dict[ axi gpio 6'] 
gpio Y2 = AxiGPIO(gpio 6). channell 
gnio Y3 = AxiGPIO(gpio 6). channe12 


G) 二 一 四 译 码 器 的 功能 验证 代码 : 


mask = Oxbl 

gpio E. write (0, mask) 
gpio A. write(0, mask) 
gpio B. write (0, mask) 


YO-gpio YO. read () 
Yi-gpio Yl. read() 
Y2-gpio Y2. read () 
Y3-gpio Y3. read () 
print(YO, Y1, Y2, Y3) 
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3) 源 代码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 1. 1 节 。 
4. 实验 步骤 

实验 步骤 同 8. 1.1 节 。 


8.1.3 多 路 选择 器 


1. 实验 目的 

掌握 基于 PYNGQ 平台 及 Vivado 工具 的 组 合 逻 辑 电路 的 开发 流程 及 调试 方式 。 了 解 一 
位 二 选 一 多 路 选择 器 的 基本 构成 和 工作 原理 ,能 够 在 此 二 选 一 多 路 选择 器 的 基础 上 搭建 一 
位 四 选 一 多 路 选择 器 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 *. v” 源 文件 生成 IP, 并 采用 原理 
图 的 方式 调用 所 生成 的 IP 设计 所 要 求 的 系统 。 采 用 Vivado 进行 仿真 ,并 进行 L/O 的 连接 ， 
最 后 生成 比特 流 文件 ,并 下 板 完 成 验证 。 

3. 实验 说 明 

1) 实验 原理 

一 位 二 选 一 多 路 选择 器 的 真 值 表 、 卡 诺 图 及 对 应 的 原理 图 如 图 8-6 所 示 。 
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(a) 真 值 表 (b) 卡 诺 图 (c) 原理 图 


图 8-6 一 位 二 选 一 多 路 选择 器 


它 有 2 个 输入 D, M D ,一 个 选择 输入 S 和 一 个 输出 Y。 二 选 一 多 路 选择 器 根据 选择 
信号 的 值 在 2 个 输入 数据 中 选择 一 个 数据 输出 。 一 个 二 选 一 多 路 选择 器 可 以 用 与 或 两 级 逻 
辑 实现 ,其 布尔 表达 式 可 以 通过 卡 诺 图 或 者 分 析 得 到 。 

先 完成 一 位 二 选 一 多 路 选择 器 的 实验 ,再 视 情况 完成 一 位 四 选 一 多 路 选择 器 的 设计 实验 


(一 个 N 选 一 多 路 选择 器 需要 log N 条 选择 线 )。 Sio 

四 选 一 多 路 选择 器 可 以 使 用 与 或 两 级 逻辑 实现 ,也 suf 

可 以 使 用 多 个 二 选 一 多 路 选择 器 实现 。 Do :] " D, d » 
一 位 二 选 一 多 路 选择 器 和 一 位 四 选 一 多 路 。 D D. 

选择 器 的 电路 符号 如 图 8-7 所 示 。 (a) 二 选 一 多 路 选择 器 (D) 四 选 一 多 路 选择 器 
2) Python 交互 模板 图 8-7 多 路 选择 器 
CD 加 载 比特 流 ( 二 选 一 多 路 选择 器 的 

Python 交互 模板 ) 的 程序 代码 : 


from pyng import Overlay 
from pyng.lib import AxiGPIO 
overlay = Overlay(" /home/xilinx/ jupyter notebooks/wzg/....bit") 
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(2) GPIO 口 的 命名 要 与 原理 图 的 连接 一 致 ,代码 如 下 : 


gpio 0 = overlay. ip_dictľ axi gpio 0] 
gpio DO = AxiGPIO(gpio 0). channell 
gpio S = AxiGPIO(gpio 0).channel2 
gpio l = overlay.ip dict['axi gpio 1'l 
gpio Dl = AxiGPIO(gpio 1). channell 
gpio 5 = overlay.ip dict[' axi gpio 5'] 
gnio Y = AxiGPIO(gpio 5).channell 


(3) 二 选 一 多 路 选择 器 的 功能 验证 的 程序 代码 : 


mask = Obl 

gpio DO. write(0, mask) 
gpio Dl. write(1, mask) 
goio S. write (l, mask) 


Y-gpio Y.read() 
print Y 


30 源 代码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 1. 1 节 。 
4. 实验 步骤 

实验 步骤 同 8.1.1 节 。 


8.1.4 触发 器 与 寄存 器 


1. 实验 目的 

掌握 基于 PYNQ 平台 及 Vivado 工具 的 时 序 逻 辑 电 路 的 开发 流程 及 调试 方式 。 了 解 
SR 锁 存 器 .D 锁 存 器 和 D 触发 器 的 基本 构成 和 工作 原理 ,能 够 在 DD 触发 器 的 基础 上 进一步 
设计 带 使 能 端 和 同步 复位 功能 的 触发 器 ,并 最 终 完 成 搭建 一 个 带 使 能 端 和 同步 复位 功能 的 
2 位 寄存 器 的 实验 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 “. v” 源 文件 生成 IP, 并 采用 原理 
图 的 方式 调用 所 生成 的 IP 设计 所 要 求 的 系统 。 采 用 Vivado 进行 仿真 ,并 进行 /O 的 连接 ， 
最 后 生成 流 文件 ,并 下 板 完成 验证 。 

3. 实验 说 明 

1) 实验 原理 

CD SR 锁 存 器 : SR 锁 存 器 由 一 对 交叉 耦合 的 或 非 门 组 成 ,其 原理 图 .电路 符号 以 及 真 
值 表 如 图 8-8 所 示 。SR 锁 存 器 有 两 个 输入 S 和 R, 两 个 输出 Q 和 Q。 输入 S 和 有 R 分 别 表 
示 置 位 和 复位 。 置 位 表示 将 Q 设置 为 1, 复位 表示 将 Q 设置 为 0。 当 输入 S 和 R 均 为 无 效 
时 ,Q 将 保持 原来 的 值 Q, PE. SAR 同时 有 效 是 没有 意义 的 ,这 样 会 产生 两 个 输出 为 0 
的 混乱 电路 响应 。 

(2) D 锁 存 器 : D 锁 存 器 的 原理 图 、 电 路 符号 以 及 真 值 表 如 图 8-9 所 示 。D 锁 存 器 避免 
了 S 和 了 R 同 时 有 效 的 情况 。 当 CLK=0 时 ,D 锁 存 器 是 不 透明 的 ,无论 DD 为 何 值 ,有 S=R=0， 
输出 Q 保持 原来 的 值 Q,. 。 当 CLK=1 时 ,D 锁 存 器 是 透明 的 ,数据 DD 通过 DD 锁 存 器 流向 
Q, 有 Q=D。 

G) D 触发 器 : 一 个 D 触发 器 可 以 由 反 相 时 钟 控制 的 两 个 背靠背 的 D 锁 存 器 构成 , 它 
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(a) 原理 图 (b) 电路 符号 (c) 真 值 表 
图 8-8 SR 锁 存 器 
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(2) 原理 图 外 电路 符 呈 ORR 


图 8-9 D 锁 存 器 


的 原理 图 .电路 符号 及 简化 的 电路 符号 如 图 8-10 所 示 。D 触发 器 在 时 钟 上 升 沿 将 D 复制 到 
Q, 在 其 他 时 间 DD 触发 器 保持 原来 的 状态 。 当 CLK—0 时 , 锁 存 器 L1 是 透明 的 , 锁 存 器 L2 
是 不 透明 的 ,D 的 值 传递 到 NT; 当 CLK — 1 时 , 锁 存 器 L1 是 不 透明 的 , 锁 存 器 L2 是 透明 的 ， 
NI 的 值 传递 到 Qs 在 其 他 时 刻 , 因 为 总 有 一 个 阻塞 D 到 Q 的 锁 存 器 ,所 以 Q 保 持原 来 的 值 。 


CLK 
CLK CLK Y 
Ddo Qop do Jp» oL L 
L| QI L2 Q-Q Qr 
(a) 原理 图 (b) 电路 符号 (c) 简化 的 电路 符号 
图 8-10 DD 触发 器 


(4) 带 使 能 端的 触发 器 : 带 使 能 端的 触发 器 增加 一 个 称 为 EN 的 输入 ,该 输入 用 于 确定 
时 钟 沿 是 否 载 人 数据 。 当 EN=1 时 , 带 使 能 端的 触发 器 与 普通 D 触发 器 一 样 ; 当 EN=0 
时 , 带 使 能 端的 触发 器 忽略 时 钟 ,保持 原来 的 状态 、 当 希望 在 某 些 时 钟 沿 而 不 是 所 有 时 钟 沿 
载 人 一 个 新 值 时 , 带 使 能 端的 触发 器 就 派 上 了 用 场 。 

注意 : 不 要 在 时 钟 上 执行 远 辑 (在 时 钟 上 改动 ) ,因为 可 能 会 使 时 钟 延 时 并 导致 时 序 错误 。 

O) 带 同 步 复位 功能 的 触发 器 : 带 同 步 复 位 功能 的 触发 器 增加 了 一 个 称 为 RESET 的 
输入 。RESET 是 一 个 低 电 平 有 效 的 信号 , 即 当 其 为 0 时 执行 复位 功能 。 当 RESET—0 时 ， 
带 同步 复位 功能 的 触发 器 忽略 输入 DD 并 在 时 钟 上 升 沿 将 输出 Q 复位 为 0; 当 RESET=1 
时 , 带 同步 复 位 功能 的 触发 器 与 普通 D 触发 器 一 样 。 

(6) 带 使 能 端 和 同步 复位 功能 的 触发 器 。 

带 使 能 端 和 同步 复位 功能 的 触发 器 增加 了 两 个 输入 EN 和 RESET. EN 的 优先 级 比 
RESET 高 , 即 EN 为 1 时 ,RESET 无 效 。 

2) Python 交互 模板 

CD 加 载 比 特 流 (2 位 寄存 器 的 Python 交互 模板 ) 的 程序 代码 : 

from pynq import Overlay 


from pyng.lib import AxiGPIO 
overlay = Overlay("/home/xilinx/ jupyter notebooks/.... bit”) 
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(2) GPIO 的 命名 要 与 原理 图 的 连接 一 致 ,其 程序 代码 如 下 : 


gnio 0 = overlay. ip_dict[ axi gpio 0'] 
gnio CLK = AxiGPIO(gpio 0). channell 
gpio EN = AxiGPIO(gpio 0). channe12 
gpio l = overlay.ip dict axi gpio 1] 
gpio RESET = AxiGPIO(gpio 1).channell 
gpio D = AxiGPIO(gpio 1).channel2 
gpio 5 = overlay.ip dicti axi gpio 5'] 
gpio Q = AxiGPIO(gpio 5).channell 


(3) 验证 寄存 器 功能 的 程序 代码 : 


maskl = Obl 

mask2 = Obll 

* PETLA, EN=1, RESET-1, D-2'b10, WEQE EAZ b10 
pio CLK. vrite(0b0, nask1) 

gpio EN. write (0bl, nask1) 

gpio RESET.vrite Obl,naskl 

gpio D. vri te (0b10, nask2) 

gio CLK. vrite(0b1, nask1) 

G-gpio Q. read 

print (bin(Q)) 


$ECLONEIHPIREZLS, EN=0, RESET-0, D-2'b10, UE QA EAZ b10 
gpio CLK. wri te(0b0, nask1) 
gio EN.vrite ObO, naskl 
gpio RESET. write (050, nask1) 
gpio D. write(0510, nask2) 
gpio CLK. wri te(0b1, nask1) 
Q-gpio Q. read 
print (bin(Q)) 
3) 源 代码 
本 实验 源 代码 中 所 含 文件 介绍 同 8. 1. 1 节 。 
4. 实验 步骤 


实验 步骤 同 8.1.1 节 。 


8.1.5 移 位 寄存 器 


1. 实验 目的 

掌握 基于 PYNQ 平台 及 Vivado 工具 的 时 序 逻 辑 电路 的 开发 流程 及 调试 方式 。 了 解 移 
位 寄存 器 的 基本 构成 和 工作 原理 ,能 够 在 此 基础 上 将 其 改进 成 3 位 带 并 行 加载 的 移 位 寄存 器 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 ?所 提供 的 “. v” 源 文件 生成 IP, 并 采用 原理 
图 的 方式 调用 所 生成 的 IP 设计 所 要 求 的 系统 。 采 用 Vivado 进行 仿真 ,并 进行 7O 的 连接 ， 
最 后 生成 流 文件 ,并 下 板 完 成 验证 。 

3. 实验 说 明 

1) 实验 原理 

CD 移 位 寄存 器 : 移 位 寄存 器 的 原理 图 如 图 8-11 所 示 , 它 由 N 个 触发 器 串联 而 成 。 移 
位 寄存 器 包括 时 钟 、 串 行 输入 Sa BITA So 和 N 位 并 行 输出 Qs_1,。。 在 时 钟 的 每 一 个 上 
升 沿 , 从 S, 移入 一 个 新 的 位 ,所 有 后 续 内 容 都 向 前 移动 。 移 位 寄存 器 可 以 完成 串 行 到 并 行 的 
转换 。 输 入 由 S, 以 串 行 方式 提供 ,在 N 个 周期 后 ,前面 的 N 位 输入 可 以 在 Q 中 并 行 访问 。 

(2) 带 并 行 加 载 的 移 位 寄存 器 : 带 并 行 加 载 的 移 位 寄存 器 增加 了 并 行 输入 Ds_1,。 和 控 
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Si a S 


Qo Qi Q: Qxa 
图 8-11 移 位 寄存 器 


制 信号 Load, 它 既 可 以 完成 串 行 到 并 行 的 转换 ,也 可 以 完成 并 行 到 串 行 的 转换 。 当 Load 有 
效 时 ,触发 器 从 输入 D 中 并 行 加 载 数据 ,否则 移 位 寄存 器 正常 移 位 ,在 N 个 周期 后 就 将 
Dx-_1,o 以 串 行 的 方式 输出 。 

2) Python 交互 模板 

CD 加 载 比特 流 ( 带 并 行 加 载 的 移 位 寄存 器 的 Python 交互 模板 ) ,代码 如 下 : 


(2) GPIO 的 命名 要 与 原理 图 的 连接 一 致 ,代码 如 下 s 


(3) 验证 移 位 寄存 器 的 并 行 到 串 行 的 转换 ,代码 如 下 : 
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3) 源 代码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 1. 1 节 。 
4. 实验 步骤 

实验 步骤 同 8. 1.1 节 。 


8.1.6 计数 器 


1. 实验 目的 

了 解 三 位 二 进 制 计数 器 的 工作 原理 ,实现 其 功能 ,并 完成 十 进 制 计数 器 的 设计 与 实现 。 

2. 实验 要 求 

要 求 采 用 源 代 码 中 对 应 目录 下 的 “基础 模块 ?所 提供 的 “. v” 源 文件 生成 IP, 并 采用 原理 
图 的 方式 调用 所 生成 的 IP 设计 所 要 求 的 系统 。 采 用 Vivado 进行 仿真 ,并 进行 1//O 的 连接 ， 
最 后 生成 比特 流 文 件 , 并 下 板 完成 验证 。 

3. 实验 说 明 

1) 实验 原理 

三 位 二 进 制 计数 器 原理 图 、 人 逻辑 表达 式 及 对 应 的 真 值 表 如 图 8-12 所 示 。 通 过 以 上 原理 
图 可 以 完成 三 位 二 进 制 计数 器 的 设计 ,设计 需要 包含 三 个 IK 触发 器 和 一 个 与 门 ,JK 触发 
器 输入 端 J,K 都 为 1 时 ,输出 端 Q0 会 不 断 地 在 时 钟 上 升 沿 进行 0—1 翻转 ,实现 计数 功能 ， 
通过 理解 三 位 二 进 制 计数 器 ,再 视 情 况 完成 十 进 制 计 数 器 的 设计 实验 ,如 图 8-13 所 示 。 


1 & 
Hi Sj u a [du Q Jke 
Inm <0 
I—PCI FF, 1 FF, 中 CI1FF， 
re JEK 
| IK P IK P IK P ER 
cP | Ja 47K, 47QQi7 Qi 2 
(a) 原理 图 (b) 逻辑 表达 式 
状态 Q Qi Qo 
0 000 
1 001 
2 010 
3 on 
4 100 
5 101 
6 110 
7 111 
(c) 真 值 表 


图 8-12 三 位 二 进 制 计 数 器 


2) Python 交互 模板 
CD 加 载 比 特 流 代码 : 


from pynq import Overlay SIBEPythonl- 
from pynq.lib import AxiGPIO 
overlay = Overlay("/hone/xilinx/jupyter notebooks/...... bit^) Shit X HG 


overlay? 
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图 8-13 ”十进制 计数 器 原理 图 
(2) GPIO 口 的 命名 代码 : 


(3) GPIO 口 的 读 写 , 代 码 如 下 : 
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3) 源 代码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 1. 1 节 。 
4. 实验 步骤 

实验 步骤 同 8. 1. 1 节 。 


8.1.7 BIRRA 


1. 实验 目的 
学 习 三 段 式 状态 机 的 基本 构成 和 工作 原理 ,实现 三 段 式 状态 机 并 对 其 加 以 改进 和 优化 。 
2. 实验 要 求 


要 求 采 用 源 代 码 中 对 应 目录 下 的 “基础 模块 ?所 提供 的 “. v” 源 文件 生成 IP, 并 采用 原理 
图 的 方式 调用 所 生成 的 IP 设计 所 要 求 的 系统 。 采 用 Vivado 进行 仿真 ,并 进行 1/O 的 连接 ， 
最 后 生成 比特 流 文件 ,并 下 板 完成 验证 。 

3. 实验 说 明 

1) 实验 原理 

状态 机 的 原理 图 、 简 化 的 下 一 个 状态 表 和 简化 的 输出 表 如 图 8-14 所 示 。 当 输入 特定 值 
时 ,状态 机 的 状态 也 会 发 生 改变 ,简化 的 状态 转换 表 如 图 (b) 所 示 。 此 状态 机 为 一 个 简易 密 
码 锁 ,如 果 输 入 的 S, A S 为 11, 则 状态 机 会 从 状态 0 进入 状态 1; 如 果 继 续 输入 的 数值 为 
01, 则 会 进入 状态 2 并 打开 锁 ; 如 果 继 续 输入 的 不 是 01, 则 回 到 状态 0。 


Ai Ao CLK 
| 
ji 


Si Sı 
d ) Unlock 
f 
i 
Reset 
(a) 状态 机 原理 图 
当前 状态 输 入 下 一 个 状态 
S, S2 Ai Ao Si S 
0 0 0 0 0 0 
0 0 0 1 0 0 当前 状态 输出 
0 0 1 0 0 0 So Si Y 
0 0 1 1 0 1 0 0 0 
0 1 0 1 1 0 0 1 0 
1 0 x x 0 0 1 0 1 
(b) 简化 状态 表 (c) 简化 的 输出 表 


图 8-14 有 限 状 态 机 


按 上 述 的 原理 图 连接 各 元 件 完成 状态 机 实验 ,在 用 Python 进行 上 班 实验 时 需要 用 到 
图 8-14(b) 状 态 表 中 A 与 Au 的 数值 ,通过 它们 的 数值 变化 来 改变 状态 机 的 状态 , 当 S, 与 
S, 为 1.0 时 ,Y 输 出 值 为 1, 否则 都 为 0。 
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2) Python 交互 模板 
CD 加 载 比特 流 的 代码 : 


(2) GPIO 口 命名 的 代码 : 


(3) GPIO 口 读 写 的 代码 : 


3) 源 代码 
本 实验 源 代码 中 所 含 文件 介绍 同 8. 1. 1 节 。 
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4. 实验 步骤 
实验 步骤 同 S. 1. 1 节 。 


8.1.8 运算 器 /ALU 


1. 实验 目的 

通过 将 ALU 所 需要 的 基本 功能 模块 连接 成 完整 的 ALU ,理解 ALU 的 功能 和 工作 机 
制 。 本 实验 的 ALU 部 分 来 自 开源 RISC-V 处 理 器 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 ”所 提供 的 *. v” 源 文件 生成 IP, 并 采用 原理 
图 的 方式 调用 所 生成 的 IP 设计 所 要 求 的 系统 。 采 用 Vivado 进行 仿真 ,并 进行 L/O 的 连接 ， 
最 后 生成 流 文件 ,并 下 板 完成 验证 。 

3. 实验 说 明 

1) 实验 原理 

ALU 的 真 值 表 如 表 8-1 所 列 ,普通 ALU 中 包括 上 表 给 出 的 12 种 操作 指令 ,每 个 info 
对 应 不 同 的 指令 类 型 ,输入 特定 的 info 可 以 实现 特定 的 指令 操作 ,通过 修改 调试 程序 可 以 


实现 不 同 的 计算 功能 。 
表 8-1 ALU 真 值 表 
指令 类 型 Info[31:0] 说 明 
LUI 0xc008 Imm 一 一 12( 左 移 12 fi) 
SUB 0x28 rs] — rs2 
ADD 0x18 rs1 十 rs2 
ADDI 0x8018 rs1 十 imm 
SLT 0x1008 if(rsl —rs2) return 1;else return 0 
SLTI 0x9008 if(rsl imm) return 1;else return 0 
XOR 0x48 rsl^rs2( 异 或 ) 
OR Ox408 rsl|rs2( 或 ) 
AND Ox808 rsl&rs2( 与 ) 
SLL 0x88 rsl EHEH rs2 位 
SRL Ox108 rs] 逻辑 右 移 rs2 位 
SRA 0x208 rsl 算术 右 移 rs2 位 


实验 内 包含 普通 ALU 模块 和 运算 通路 模块 两 个 部 分 ,其 中 普通 ALU 模块 接收 输入 进 
来 的 info 来 判断 是 何 种 操作 类 型 ,并 将 输入 进来 的 操作 数 和 操作 类 型 发 送 给 运算 通路 模 
块 ,运算 通路 模块 将 接收 到 的 操作 数 进 行 相应 的 运算 ,将 结果 返回 给 普通 ALU 模块 。 

2) Python 交互 模板 

CD 加 载 比 特 流 的 代码 : 


from pynq import Overlay #2 APy thon 
from pynq. lib import AxiGPIO 
overlay = Overlay("/home/xilinx/jupyter notebooks/...... bit”) SbitX HG 


overlay? 
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(2) GPIO 口 命名 的 代码 : 


gpio 0 = overlay. ip_dict[ axi_gpio 0 ] 

gpio_rsl = AxiGPIO(gpio 0).channell HRA RERO RE 
gpio_rs2 = AxiGPIO(gpio 0).channel2 

gpio_l = overlay.ip dict['axi gnio 1'] 

gpio im» = AxiGPIO(gpio 1).channell 

gpio info = AxiGPIO(gpio 1). channe12 

gpio 2 = overlay.ip dict['axi gpio 2'] 

gpio wdat = AxiGPIO(gpio 2). channell 


(3) GPIO 口 读 写 的 代码 : 


mask = Oxffffffff SGPIOfESS 
gpio rsl. write (8, mask) ESAE 
gpio rs2. write (3, mask) 

gpio imm. write (0, mask) 

gpio info. write(0x18, mask) 

wdat = gpio wdat. read() 


print (wdat) DRAR 
3) 源 代 码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 1. 1 节 。 

4. 实验 步骤 


实验 步骤 同 8.1.1 节 。 


8.1.9 存储 器 


1. 实验 目的 

通过 对 基本 存储 器 模块 的 使 用 ,及 使 用 多 个 存储 器 模块 搭建 更 大 的 存储 器 系统 ,理解 和 
掌握 存储 器 的 基本 原理 和 用 法 。 

2. 实验 要 求 

根据 提供 的 存储 器 基本 模块 ,以 字 扩展 (地 址 扩展 ) 的 方式 把 2 片 存储 器 连接 成 容量 更 
大 的 存储 器 系统 ,完成 仿真 ,并 下 板 完 成 验证 。 

3. 实验 说 明 

1) 实验 原理 

基础 模块 中 包含 两 个 独立 的 存储 器 单元 ,分 别 为 mem2 和 mem2_1, 写 人 和 读 出 数据 时 
都 需要 选择 存储 器 。 通 过 片 选 可 以 控制 要 写 人 和 读 出 的 为 哪 一 个 存储 器 , 片 选 信号 能 为 
info 的 第 0 和 1 位 , 当 使 用 mem2 时 ,info 最 低 的 两 位 要 使 用 数值 01 才 可 以 正常 地 写 入 和 
读 出 ; 当 使 用 mem2_1 时 ,info 最 低 的 两 位 为 10, 如 果 片 选 信号 错误 , 则 存储 器 将 不 能 正常 
地 写 和 信和 读 出 数据 。 

2) Python 交互 模板 

(1) 加 载 比特 流 的 代码 : 


from pynq import Overlay FIBAIPythonE- 
from pynq.lib import AxiGPIO 
overlay = Overlay("/hone/xilinx/jupyter notebooks/...... bit^) #bit Kf ERTE 


overlay? 
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(2) GPIO 口 命名 的 代码 : 


gnio 0 = overlay.ip dict['axi gpio 0'] 
gpio_1 = overlay.ip dict['axi gpio 1'] 
gpio_2 = overlay. ip_dictľ axi gpio 2'] 


infol = AxiGPIO (gio 0). channell BEDAE 
wdatal = AxiGPIO (gpio 0).channel2 

info2 = AxiGPIO (gio 1). channell 

wdata2 = AxiGPIO(gpio 1).channel2 


rdatal = AxiGPIO(gpio 2).channell 
rdata2 = AxiGPIO(gpio 2).channel2 


(3) GPIO 口 读 写 的 代码 : 


mask = Oxffffffff AGPIOfÉRI 
infol. write (0x15, mask) HRABE 
wdatal. write (0x99999999, mask) HEA SE 


infolwrite(0x1l, mask) 
outl = hex(rdatal. read ()) 
print('outl -',outl) AITEIIGE 


info2.write(0x26, mask) 

wdata2. write(0x88888888, mask) 

info2.write(0x22, mask) 

out2 = hex (rdata2. read ()) 

print('out2 -', out2) 
30 源 代 码 

本 实验 源 代 码 中 所 含 文件 介绍 同 8. 1.1 节 。 
4. 实验 步骤 

实验 步骤 同 S. 1. 1 节 。 


8.1.10 寄存 器 堆 


1. 实验 目的 

了 解 寄 存 器 的 基本 构成 和 工作 原理 ,能 够 在 单个 寄存 器 基础 上 搭建 寄存 器 组 ,实现 具有 
5 个 寄存 器 的 数据 通路 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 “. v” 源 文件 生成 IP, 并 采用 原理 


图 的 方式 调用 所 生成 的 IP. 设计 所 要 求 的 系统 。 

采用 Vivado 进行 仿真 ,并 进行 1O 的 连接 ,最 后 ss 

生成 比特 流 文件 ,并 下 板 完成 验证 。 qum 
外 EN ii Foot 
D 实验 原理 寄存 器 3 
如 图 8-15 所 示 ,数据 写 人 时 默认 和 暂 存 到 寄存 

器 DR 中 ,DR 的 输出 可 以 更 新 RO RA 中 的 任意 aum 


一 个 寄存 器 ,更 新 到 具体 哪 一 个 寄存 器 需要 由 各 


个 寄存 器 的 使 能 信号 决定 , 当 某 个 寄存 器 使 能 为 Me TERTEM 
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1 时 ,寄存 器 DR 中 的 数据 进入 相应 的 寄存 器 中 ,接收 到 数据 的 寄存 器 将 数据 暂 存 , 并 将 数 
据 发 送 到 接收 端 以 供用 户 观 察 实验 效果 。 

2) Python 交互 模板 

CD 加 载 比 特 流 的 代码 : 


from pynq import Overlay PIBIPythonHE 
from pynq.lib import AxiGPIO 

overlay = Overlay ("/home/xilinx/jupyter notebooks/...... bit”) #bit K fR IE 
overlay? 


(2) GPIO 口 命名 的 代码 : 


gpio_0 = overlay.ip dict['axi gpio 0'] 
gpio 1 = overlay.ip dict[' axi gpio 1'] 
gpio 2 = overlay.ip dict['axi gpio 2'] 
gpio 3 = overlay.ip dict['axi gpio 3'] 


read idxl = AxiGPIO (gpio O).channell SLATE 
read idx2 = AxiGPIO (gpio O). channel2 

w_idx = AxiGPIO(gpio 1).channell 

w_data = AxiGPIO(gpio 1).channel2 


read datal = AxiGPIO (gpio 2).channell 
read data2 = AxiGPIO(gpio 2).channel2 


(3) GPIO 口 读 写 的 代码 : 


mask = Oxffffffff XGPIOREST 
widx.write(0x00000001, mask) FARE 
w_data. write (OxfOfOfOfO, mask) 

read idx2.write(0x00000001, mask) 


out = hex(read data2.read()) FEEGDISUSUE 
print(out) SIT PRE 

D 源 代码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 1. 1 节 。 

4. 实验 步骤 


实验 步骤 同 8. 1. 1 节 。 


8.1.11 总 线 


1. 实验 目的 

了 人 解 总 线 的 基本 构成 和 工作 原理 ,实现 基于 总 线 进行 数据 传输 的 寄存 器 数据 写 入 与 读 取 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 *. v” 源 文件 生成 IP, 并 采用 原理 
图 的 方式 调用 所 生成 的 IP 设计 所 要 求 的 系统 。 采 用 Vivado 进行 仿真 ,并 进行 L/O 的 连接 ， 
最 后 生成 比特 流 文件 ,并 下 板 完 成 验证 。 

3. 实验 说 明 

1) 实验 原理 

本 实验 采用 蜂鸟 E203 处 理 器 中 自 定义 的 总 线 协议 ICB(Internal Chip Bus) 。 该 总 线 应 
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用 于 蜂鸟 E203 处 理 器 中 ,其 结合 AXI 总 线 和 AHB 总线 的 优点 , 兼 具 高 速 性 和 易 用 性 。 其 
总 线 通 道 结构 如 图 8-16 所 示 。 


地 址 和 | 地 址 和 | 地 址 和 | 地 址 和 
控制 信息 | 控制 信息 | 控制 信息 | 控制 信息 
p -— -— -— -— n 
Ht 接 
返回 通道 H 
返回 返回 返回 返回 
结果 结果 结果 结果 
图 8-16 总线 通道 结构 
表 8-2 所 示 为 ICB 总 线 的 参数 。 
表 8-2 ICB 总 线 信号 
通道 方向 宽度 信号 名 ^ a 
Output 1 Icb. cmd, valid 主 设备 向 从 设备 发 送 读 写 请 求 信号 
Input 1 Icb cmd ready 从 设备 向 主 设备 返回 读 写 接收 信和 号 
Output 8 Icb cmd addr 读 写 地 址 
AES 
biis! Output 1 Icb cmd read 读 写 指示 
Output 16 Icb cmd. wdata 写 操作 的 数据 
Output 16 Icb cmd. wmask 写 操 作 时 的 字 节 掩 码 
Input i Icb rsp valid 从 设备 向 主 设备 发 送 读 写 反 馈 请 求 信号 
返回 通道 Output 1 Icb rsp ready 主 设备 向 从 设备 返回 读 写 反馈 接收 信号 
Input 16 Icb rsp rdata 读 反馈 的 数据 
Input 1 Icb_rsp_err 读 或 写 反馈 的 错误 标志 


表 中 : 命令 通道 (Command Channel) 主 要 用 于 主 设备 向 从 设备 发 起 读 写 请 求 ; 返回 通 
道 (Response Channel) 主要 用 于 从 设备 向 主 设备 返回 读 写 结 果 。 
ICB 总 线 时 序 有 若干 种 ,图 8-17 为 典型 时 序 中 的 其 中 一 种 : 主 设备 向 从 设备 通过 ICB 
的 Command Channel 发 送 写 操作 请 求 (icb_cmd_read 为 低 ), 从 设备 立即 接收 该 请 求 (icb_ 
cmd ready 为 高 )。 从 设备 在 同一 个 周期 返回 读 结果 且 结 果 正 确 (icb_rsp_err 为 低 ), 主 设备 
立即 接收 该 结果 (icb_rsp_ready 为 高 ) 。 
源 代码 中 包含 总 线 模块 和 ram 模块 两 个 部 分 ,其 中 PYNQ 的 PS 端 为 主 模块 ,ram Bi 
块 为 从 模块 ,用 户 通 过 PS 端 发 送 数据 ,总 线 模块 接收 数据 并 将 数据 传 入 ram 模块 中 ,完成 


本 实验 后 可 以 根据 学 习 情 况 根 据 ICB 总 线 协议 自行 设计 一 个 从 模块 并 进行 验证 。 


2) Python 交互 模板 
CD 加 载 比特 流 的 代码 : 


icb cmd addr 一 各- 一 一 一 ———————— 


icb cmd read | | L 
1 ZZ 727 7277 ZZ ZZ 


icb cmd wdata ZZ 


i j I 
icb cmd_wmask 77, BA 
i T 


M 


TREE RENE 
icb rsp valid | y N\ 3 i ] i ] | i 
- ' 1 
i 


icb rsp ready i 1 1 


> 
icb rsp rdata TFT mE 1 


icb rsp err i i i i 


] i 1 | 


图 8-17 典型 时 序 


from pynq import Overlay 
from pynq. lib import AxiGPIO 


overlay? 


overlay = Overlay (^ /home/xilinx/jupyter notebooks/. 


EIBIHPython/E 


AEA bit") — sbit X fHfé 


(2) GPIO 口 命名 的 代码 : 


overlay. ip dict[' axi gpio 0 ] 
overlay. ip dict['axi gpio l'] 
overlay. ip dict[' axi gpio 2'] 
overlay. ip dict['axi gpio 3'] 
overlay. ip dict['axi gpio 4'] 
overlay. ip dict['axi gpio 5'] 


gpio 0 
gpio l 
gpio 2 
gpio 3 
gpio 4 
gpio 5 


ifu2biu cmd valid = AxiGPIO(gpio 0).channell 
ifu2biu cmd addr - AxiGPIO(gpio 0). channe12 
ifu2biu cmd read = AxiGPIO(gpio 1). channell 
ifu2biu cmd wdata = AxiGPIO(gpio 1).channel2 
ifu2biu cmd wmask = AxiGPIO(gpio 2).channell 
ifu2biu rsp ready = AxiGPIO(gpio 2).channel2 
mem icb enable = AxiGPIO(gpio 3). channell 
icb2biu cmd ready = AxiGPIO (gpio 3). channel2 
ifu9biu rsp valid = AxiGPIO(gpio 4).channell 
ifu2biu rsp err = AxiGPIO(gpio 4).channel2 
ifu2biu rsp rdata = AxiGPIO(gpio 5).channell 


EROR RE 


(3) GPIO 口 读 写 的 代码 : 
mask = Oxffff 
ifu2biu cmd valid.write (0b1, mask) 
ifu2biu cmd addr. write (0x01, mask) 
ifu2biu cmd read. write(0b0, mask) 
ifu2biu rsp ready. write (0bl, mask) 
ifu2biu cmd wdata. write (Oxeeee, mask) 
ifu2biu cmd wmask. write (0xffff, mask) 
mem icb enable. write(0bl, mask) 


SGPIOBA PEIG 
BUS D TE 
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mask = Oxffff 
ifu2biu cmd read. write (0b1, mask) "il fioi HE 
ifu2biu cmd addr. write (0x01, mask) 


print(ifu2biu rsp err. read 0) EITI 
rdata = hex(ifu2biu rsp rdata. read 0) 
print (rdata) 


3) 源 代码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 1.1 节 。 
4. 实验 步骤 

实验 步骤 同 8. 1. 1 节 。 


8.1.12 ” 微 程序 控制 器 


1. 实验 目的 

掌握 基于 PYNQ 平 台 及 Vivado 工具 的 时 序 逻 辑 电路 的 开发 流程 及 调试 方式 。 本 实验 
提供 了 一 个 简单 的 CPU 模型 机 ,要 求学 生 在 理解 其 工作 原理 的 基础 上 ,补充 完善 微 程序 控 
制 器 中 微 程 序 的 设计 ,使 其 可 以 仿真 并 下 板 运行 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 “. v” 源 文件 生成 IP, 并 采用 原理 
图 的 方式 调用 所 生成 的 IP 设计 所 要 求 的 系统 。 采 用 Vivado 进行 仿真 ,并 进行 1/O 的 连接 ， 
最 后 生成 比特 流 文 件 , 并 下 板 完成 验证 。 

3. 实验 说 明 

1) 实验 原理 

(1) CPU 数据 通路 : 如 图 8-18 所 示 ,每 一 条 机 器 指令 的 执行 过 程 都 可 分 为 取 指 和 执行 
两 个 阶段 。 

程序 计数 器 (PC) 是 一 条 指令 的 起 点 ,所 以 在 取 指 阶段 ,首先 由 PC 输出 将 要 执行 的 机 器 
指令 的 地 址 ,接着 指令 存储 器 (Imem) 将 与 该 地 址 对 应 的 机 器 指令 输出 到 指令 寄存 器 (IR)， 
同时 PC 指向 下 一 条 要 执行 的 指令 ,为 下 次 取 指 做 准备 。 

接着 ,IR 将 指令 的 操作 码 送 入 指令 译 码 器 (Decoder) , 译 码 器 中 存储 有 与 之 对 应 的 微 程 
序 的 入 口 地址 ,将 其 送 入 到 微 程序 计数 器 (MPC) ,最终 由 MPC 确定 将 要 执行 的 微 指 令 地 
址 ,将 该 条 微 指令 从 微 指令 控制 存储 器 (CUmem) 中 读 出 .将 这 些 控 制 信和 号 发 送 送 到 CPU 
的 各 个 组 件 ,指令 便 开始 执行 。 

(2) 指令 设计 : 该 模型 机 设计 了 3 条 数据 转移 类 指令 (MOV,MOVI,LAD,LADI， 
STO) ,7 条 运算 类 指令 (ADD,SUB,INC,DEC,AND,OR,NOT) ,7 条 跳 转 类 指令 (JEQ， 
JNE,JHI,JHS,JLO,JLS,JMP) 以 及 比较 指令 (CMP) 和 停机 指令 (HLT) , 共 21 条 指令 。 
其 中 , 仅 有 LAD 5 STO 可 以 访问 存储 器 ,大 多 数 的 指令 采用 寄存 器 寻 址 ,LAD 和 STO 
的 寻 址 方式 为 间接 寻 址 , 跳 转 指令 及 部 分 第 二 操作 数 为 立即 数 的 指令 采用 立即 寻 址 
方式 。 


总 线 DBUS 
t 
ALU en 数 存 R omen on 指 在 | 
{| 运算 
= 十 地 址 | ”数据 地 址 | op 码 ! 地 址 码 
E ALU i en 3 70 f 
] [6] 100 i 
— —||B | | 一 读 写 T 
ME | E. 
Ri 30 40 ! 
Ra 31 i 
R f pe sel 
介 人 Rd_used AR en 
B AR | Jh [j^ PC 程序 计数 器 Fl 
z DR_en 75 
DR | 数据 缓存 器 
fiU T Ron 
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图 8-18 CPU 数据 通路 图 


P | 


具体 指令 设计 请 阅读 源 代码 资料 包 中 本 实验 文件 夹 中 的 “附录 2”。 
(3) 取 指 微 指令 的 实现 ， 


第 一 条 微 指令 : 
ZF_en PC en PC sel Imem en MPC en MPC sel cs we 
0 0 0 1 1 10 0 0 
ALU en B en Dmem en | IR. data en CF en Rd used RsA used RsB used 
0 0 0 0 0 0 0 0 
AR_en outenab M SI 位) Next. addr(16 位 ) 
0 0 0 0000 0000 0000 0000 0001 


O 第 一 个 周期 : PC 中 的 地 址 送 入 指令 寄存 器 (Imem) ,通过 发 送 控制 信号 Imem. en. 
使 该 地 址 对 应 的 指令 操作 码 (Opcode) 从 Imem 经 过 总 线 DBUS 进入 指令 译 码 器 ,经 过 翻 
译 , 从 指令 译 码 器 流出 的 数据 变 成 了 这 条 指令 在 CUmem 中 的 入 口 地 址 ,入 口 地 址 被 输入 
到 微 程序 计数 器 MPC 的 MPC in 中 。 同 时 发 送 了 控制 信号 MPC_sel=“10”, 代 表 下 一 条 
微 指令 地 址 将 从 CU_mem 传 回 的 next_addr 中 获取 (此 处 next_addr 即 为 取 指 程序 的 第 二 
条 微 指令 地 址 ) 。 
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第 二 条 微 指令 : 


ZF en PC en PC sel Imem en MPC en MPC sel cs we 
0 1 0 0 1 11 0 0 
ALU en B en Dmem en |IR data en | CF en Rd used | RsA used RsB used 
0 0 0 0 0 0 0 0 
AR en outenab M Sa fip Next addr(16 位 ) 
0 0 0 0000 00 0000 0000 0000 


Q 第 二 个 周期 : 由 于 控制 单元 发 送 的 微 程序 计数 器 (MPC) 的 选择 信号 MPC. sel— 
“11”( 意 为 将 MPC in 输出 ) ,指令 的 入 口 地 址 便 被 送 入 CUmem,CUmem 便 从 该 指令 入 口 
地 址 开始 ,逐条 发 送 该 指令 对 应 的 控制 信号 。 同 时 ,可 以 注意 到 表 中 的 第 二 行 ,PC_en BOE 
为 “1”, 且 PC. sel— *00" (X29 PC— PC4- D. A ifi flt PC 指向 下 一 条 指令 ,为 下 一 次 取 指 做 
好 准备 。 

(D 代码 层次 结构 如 下 : 


| -- tinycpu. v 

—— ALU. v 

—— DBUS. v 

—- Regsfile.v 

-—- Dmem. v 

—- Imem.v 

—- Program Counter. v 
—- Decoder. v 


具体 代码 请 阅读 基础 模块 文件 夹 。 
2) Python 交互 模板 
CD 加 载 比 特 流 的 代码 : 


from pynq import Overlay 
from pynq. lib import AxiGPIO 
overlay = Overlay(" /home/xilinx/jupyter notebooks/.. .|bit”) 


(2) GPIO 口 命名 的 代码 : 


gnio 5 = overlay.ip dict[ axi gpio 5'] 
gpio m0 = AxiGPIO(gpio 5). channell 
goio ml = AxiGPIO(gpio 5). channel2 
gnio 6 = overlay.ip dict[ axi gpio 6'] 
gnio m2 = AxiGPIO(gpio 6). channell 
gnio m3 = AxiGPIO(gpio 6). channel2 
gpio 7 = overlay.ip dict[ axi gpio 7'] 
goio m4 = AxiGPIO(gpio 7). channell 
gpio m5 = AxiGPIO(gpio 7). channe12 
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(3) 验证 CPU 是 否 成 功 排序 的 代码 : 


import time ABT [BIS E 
timedelay - 0.0001 NEHAS 
time. sleep (timedelay ) SEE 
tmp=[] 

m = gpio m0. read() 

tmp. append (m0) 

ml = gpio_ml. read() 

tmp. append (m1) 

m2 = gpio m2.read() 

tmp. append (m2) 

m3 = gpio m3.read() 

tmp. append (m3) 

m = gpio m4.read() 

tmp. append (n4) 

m5 = gpio mó.read() 

tmp. append (m5) 

print(tmp) 


(0, 1, 4 5, 6, 10] 


3) 源 代 码 

本 书 配 套 源 代码 中 ,为 实验 提供 了 如 下 材料 : 

(1)“ 基 础 模块 ”文件 夹 : 该 文件 夹 下 提供 的 是 每 个 实验 所 需 的 基础 模块 “. v” 源 文件 ， 
在 采用 原理 图 方式 进行 实验 时 ,用 户 可 以 将 其 生成 IP 备用 。 

(2) "test. v”: 是 对 用 户 完成 的 设计 进行 仿真 时 所 需 的 Testbench 示例 程序 ,用 户 可 直 
接 使 用 ,也 可 以 根据 需要 自行 修改 。 

(3) "cpu. ipynb” 是 本 节 “Python 交互 模板 ”部 分 所 介绍 的 Python 源 文件 。 

(4)“ 附 录 1”: AIU 运算 表 。 

(5)“ 附 录 2”: 模型 机 的 指令 说 明 。 

4. 实验 步骤 

CD 将 CUmem 中 的 微 指令 设计 完整 。 

(2) 使 用 本 实验 对 应 源 代码 中 的 simu_cpu 仿真 文件 进行 仿真 ,观察 m0 mo 的 值 是 否 
为 排序 后 的 值 (0,1,4,5,6,10)。 因 为 仿真 时 间 超 过 默认 时 间 , 所 以 需要 在 simulation 
setting 中 将 simulation runtime 设置 为 40ps。 

(3) 将 仿真 后 的 设计 生成 原理 图 添加 到 IPrepository。 

(4) 按照 图 8-19 所 示 和 接口 模块 相连 接 。 

O) 重新 综合 ,实现 及 生成 比特 流 文件 ,并 将 比特 流 文件 及 对 应 tel 文件 上 传 到 所 用 的 
PYNQ 节点 。 

(6) 下 板 实验 ,使 用 本 实验 对 应 源 代码 中 的 Python 调试 文件 ,观察 真实 运行 后 的 CPU 
模型 机 是 否 正常 工作 。 

5. 实验 建议 

学 生 可 以 按照 第 3 章 中 介绍 的 HDL 开发 流程 ,直接 将 本 实验 对 应 源 代码 中 “基础 模 
块 "文件 夹 提供 的 源 文 件 添加 到 工程 中 ,无 须 再 将 每 个 模块 生成 原理 图 的 方式 。 
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AXI GPIO 
axi gpio 4 


gpio io i[15:0]«4 
GP102 =| 
gpio2 io i[15:0]«4 


图 8-19 模型 机 与 接口 模块 连接 方式 


8.2 基于 Verilog HDL 的 实验 


8.2.1 全 加 器 


1. 实验 目的 

掌握 基于 Verilog HDL 方式 的 4 位 全 加 器 程序 设计 方法 ,通过 Vivado 软件 和 PYNQ 
平台 进行 开发 调试 ,实现 全 加 器 的 功能 ,并 通过 4 位 全 加 器 程序 完成 8 位 全 加 器 的 实现 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 “. v” 源 文件 建立 完整 的 工程 ,使 
用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 1/O 的 连 
接 , 构 成 完整 的 系统 。 最 后 生成 比特 流 文件 ,并 下 板 完成 验证 。 

3. 实验 说 明 

1) 实验 原理 

全 加 器 的 原理 图 .逻辑 表达 式 及 对 应 的 真 值 表 如 图 8-20 所 示 。 通 过 Verilog HDL 语言 
可 以 直接 编写 全 加 器 模块 直接 实现 原理 图 的 功能 .具体 全 加 器 的 代码 可 以 参考 源 代码 中 对 
应 目录 下 的 “基础 模块 ”所 提供 的 “. v” 源 文件 ,通过 理解 代码 并 完成 8 位 全 加 器 的 设计 。 


» 
Oo 
d 
将 
B 
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输入 输出 
A | Bi | Ci | Si | Cia 
0|olololon 
Cii Si 0|0|1|1]| 0 
0|1]0|1]| o 
0|1]1[0]| 1 
1]0]0|1]| o 
LA t|e[T|€| t 
一 SF=Ai@Bi@Ci LO E | 
H Cj 7AB;jrAC; HB, "UE EESEE 
C, AB, =AiBi+(Ai@Bi)Ci 
(a) 原理 图 (b) 逻辑 表达 式 (c) 真 值 表 


图 8-20 一 位 全 加 器 


2) Python 交互 模板 
CD 加 载 比特 流 的 代码 : 


from pynq import Overlay BIBAIPython/ 
from pynq.lib import AxiGPIO 

overlay = Overlay ("/hone/xilinx/jupyter notebooks/...... bit^) Sbit KREE 
overlay? 


(2) GPIO 口 命名 的 代码 : 


gpio 0 = overlay. ip_dict["axi_gpio 0'] 
gpio l = overlay.ip dict['axi gpio 1 ] 
gpio 2 = overlay. ip dict['axi gpio 2'] 


a = AxiGPIO(gpio 0). channel FLA HD ET EE 
b = AxiGPIO(gpio 0). channe12 

cin = AxiGPIO(gpio 1). channell 

s = AxiGPIO(gpio 1). channel2 

cout - AxiGPIO(gpio 2). channell 


(3) 加 法 器 功能 验证 的 代码 : 


mask = 0 ACP10 荡 三 
a. wite(8, mask) ESA SHE 
b. write(9, mask) 

cin. write (0, mask) 

print (cout. read()) ITRE 


print (s. read ()) 


3) 源 代码 

本 书 配套 源 代码 中 ,为 实验 提供 了 如 下 材料 : 

(1)“ 基 础 模块 ”文件 夹 : 该 文件 夹 下 提供 的 是 每 个 实验 所 需 的 基础 模块 “. v” 源 文件 ， 
在 进行 实验 时 ,用 户 可 以 将 其 生成 IP 直接 使 用 。 

(2) "test. v”: 是 对 用 户 整 体 工程 进行 仿真 时 所 需 的 Testbench 示例 程序 ,用 户 可 直接 
使 用 ,也 可 以 根据 需要 自行 修改 。 
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(3)“xxx. ipynb” 是 本 节 “Python 交互 模板 ?部 分 所 介绍 的 Python 源 文件 。 

4. 实验 步骤 

(1) 熟悉 基本 模块 的 代码 功能 ,可 对 基础 模块 进行 更 改 ,修改 并 使 用 本 实验 对 应 材料 中 
的 仿真 文件 进行 仿真 。 

(2) 将 本 实验 对 应 材料 中 提供 的 基本 模块 的 “. v” 文 件 生成 IP 核 。 

G) 调用 IP 核 ,进行 I/O 处 理 ,将 系统 的 逻辑 L/O 与 PS 相连 接 , 以 便 进行 调试 。 

(4) 重新 综合 、 实 现 及 生成 比特 流 文件 ,并 将 比特 流 文件 及 对 应 tel 文件 上 传 到 所 用 


PYNQ 节点 。 

(5) 下 板 实 验 , 使 用 本 实验 对 应 材料 中 的 Python 调试 文件 ,观察 真实 运行 后 的 系统 是 
否 正常 工作 。 

8.2.2 译 码 器 

1. 实验 目的 


掌握 基于 Verilog HDL 方式 的 二 一 四 译 码 器 程序 设计 方法 ,通过 Vivado 软件 和 
PYNQ 平台 进行 开发 调试 ,实现 二 一 四 译 码 器 的 功能 ,在 此 基础 上 实现 三 一 八 译 码 器 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 *. v” 源 文件 建立 完整 的 工程 ,使 
用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 /O 的 连 
接 , 构 成 完整 的 系统 。 最 后 生成 比特 流 文件 ,并 下 板 完 成 验证 。 

3. 实验 说 明 

1) 实验 原理 

二 一 四 译 码 器 的 原理 图 及 对 应 的 真 值 表 如 图 8-21 所 示 。 通 过 Verilog HDL 语言 可 以 
直接 编写 二 一 四 译 码 器 直接 实现 原理 图 的 功能 ,具体 译 码 器 的 代码 可 以 参考 源 代码 中 对 应 
目录 下 的 “基础 模块 所 提供 的 “. v” 源 文件 ,通过 理解 代码 并 完成 三 一 八 译 码 器 的 设计 。 


输 入 输 出 
B |volvi|vz|vs 
xliii]: 
ofolilili 
1| 1[0|1]1 
[ojii fola] 
i| lo 
(a) 原理 图 (b) 真 值 表 
图 8-21 二 一 四 译 码 器 
2) Python 交互 模板 
CD 加 载 比特 流 的 代码 : 
from pynq import Overlay FIBAIPythonE- 
from pynq.lib import AxiGPIO 
overlay = Overlay ("/home/xilinx/jupyter notebooks/...... bit^) #bit Kf ERTE 


overlay? 
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(2) GPIO 口 的 定义 与 原理 图 的 连接 一 致 ,其 代码 如 下 : 


gpio_0 = overlay.ip dict['exi gpio 0] PAKAH ORE 
gpio l = overlay.ip dict[' axi gpio 1'] 
gpio 2 = overlay.ip dict['axi gpio 2'] 


a = AxiGPIO(gpio 0). channel 
y = AxiGPIO(gpio 0). channe12 


(3) GPIO 口 读 写 的 代码 : 


mask = Oxf SCPIOfÉET 
a. write(3, mask) 

out = bin(y. read )) TEE 
print (out) THEE 
3) 源 代码 


本 书 配套 源 代 码 中 ,为 实验 提供 了 如 下 材料 : 

(1)“ 基 础 模块 "文件 夹 : 该 文件 夹 下 提供 的 是 每 个 实验 所 需 的 基础 模块 “. v” 源 文件 ， 
在 进行 实验 时 ,用 户 可 以 将 其 生成 IP 直接 使 用 。 

(2) "test. v”: 是 对 用 户 整体 工程 进行 仿真 时 所 需 的 Testbench 示例 程序 ,用 户 可 直接 
使 用 ,也 可 以 根据 需要 自行 修改 。 

(3) "xxx. ipynb” 是 本 节 “Python 交互 模板 ”部 分 所 介绍 的 Python 源 文件 。 

4. 实验 步骤 

CD 熟悉 基本 模块 的 代码 功能 ,可 对 基础 模块 进行 更 改 , 修 改 并 使 用 本 实验 对 应 材料 中 
的 仿真 文件 进行 仿真 。 

(2) 将 本 实验 对 应 材料 中 提供 的 基本 模块 的 “. v” 文 件 生成 IP 核 。 

(3) 调用 IP 核 ,进行 I/O 处理 ,将 系统 的 逻辑 1/0 与 PS 相连 接 , 以 便 进行 调试 。 

(4) 重新 综合 ,实现 及 生成 流 文件 ,并 将 比特 流 文件 及 对 应 tel 文件 上 传 到 所 用 PYNQ 节点 。 

(5) 下 板 实 验 , 使 用 本 实验 对 应 材料 中 的 Python 调试 文件 ,观察 真实 运行 后 的 系统 是 
否 正常 工作 。 


8.2.3 多 路 选择 器 


1. 实验 目的 

掌握 基于 Verilog HDL 方式 的 四 选 一 多 路 选择 器 程序 设计 方法 ,通过 Vivado 软件 和 PYNQ 
平台 进行 开发 调试 ,实现 四 选 一 多 路 选择 器 的 功能 ,在 此 基础 上 实现 八 选 一 译 码 器 的 功能 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 ”所 提供 的 “. v” 源 文件 建立 完整 的 工程 ,使 
用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 卫 , 并 调用 所 生成 的 IP 进行 W/O 的 连 
接 , 构 成 完整 的 系统 。 最 后 生成 比特 流 文件 ,并 下 板 完 成 验证 。 

3. 实验 说 明 

1) 实验 原理 

通过 Verilog HDL 语言 可 以 直接 编写 四 选 一 多 路 选择 器 来 实现 如 原理 图 实验 相同 的 
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功能 ,四 选 一 多 路 选择 器 的 代码 可 以 参考 源 代码 中 对 应 目录 下 的 
“基础 模块 所 提供 的 “. v” 源 文件 ,通过 理解 代码 并 完成 八 选 一 多 
路 选择 器 的 设计 。 四 选 一 多 路 选择 器 电路 符号 如 图 8-22 所 示 。 


2) Python 交互 模板 
(1) 加 载 比特 流 的 代码 : 


from pynq import Overlay 
from pynq.lib import AxiGPIO 


overlay = Overlay (^ /home/xilinx/jupyter notebooks/...... bit^) 


overlay? 


图 8-22 ”四 选 一 多 路 


SIB/HPrthon/E- iii 


sbit k MRE 


(2) GPIO 口 命名 的 代码 : 


gpio_0 = overlay. ip dict[' ari_gpio 0'] 
gpio_l = overlay. ip_dict[ axi gpio 1'] 
gpio 2 = overlay. ip dict[' axi gpio 2] 


select = AxiGPIO(gpio 0). channell 
out0 = AxiGPIO(gpio 0).channel2 
(3) GPIO 口 读 写 的 代码 : 


| mask = Oxf 
select0. write (3, mask) 
data = hex (out0. read ()) 
print (data) 


3) 源 代码 


ERA BEHDNUTÉEE 


SGPIOfÉSI 
ESASUE 
ERB ORE 
BITES 


本 实验 源 代码 中 所 含 文 件 介绍 同 8. 2. 2 35. 


4. 实验 步骤 
实验 步骤 同 8. 2.2 节 。 


8.2.4 触发 器 与 寄存 器 
1. 实验 目的 


掌握 基于 Verilog HDL 方式 的 1 位 DD 触发 器 和 8 位 寄存 器 程序 设计 方法 ,通过 Vivado 
软件 和 PYNQ 平 台 进行 开发 调试 ,实现 1 位 DD 触发 器 和 8 位 寄存 器 程序 的 功能 ,能 够 在 D 
触发 器 的 基础 上 进一步 设计 带 使 能 端 和 同步 复位 功能 的 触发 器 和 带 使 能 端 和 同步 复位 功能 


的 8 位 寄存 器 的 实验 。 
2. 实验 要 求 


要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 *. v” 源 文件 建立 完整 的 工程 ,使 
用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 W/O 的 连 


接 , 构 成 完整 的 系统 。 最 后 生成 比特 流 文件 ,并 下 板 完 成 验证 。 


3. 实验 说 明 
1) 实验 原理 


CD D 触发 器 : 一 个 DD 触发 器 可 以 由 反 相 时 钟 控制 的 两 个 背靠背 


RA 


的 D 锁 存 器 构成 ,其 简化 的 电路 符号 如 图 8-23 所 示 。D 和 触发 器 在 时 钟 ”图 8-23 DD 触发 器 
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上 升 沿 将 输入 传 给 输出 ,在 其 他 时 间 D 触发 器 保持 原来 的 状态 。 

寄存 器 中 的 一 位 用 简单 的 同步 D 触发 器 就 可 以 实现 ,8 位 的 寄存 器 是 用 了 8 个 同步 D 
触发 器 构成 。 

(2) 带 使 能 端的 触发 器 : 带 使 能 端的 触发 器 增加 一 个 称 为 EN 的 输入 ,该 输入 用 于 确定 
时 钟 沿 是 否 载 人 数据 。 当 EN=1 时 , 带 使 能 端的 触发 器 与 普通 D 触发 器 一 样 ; 当 EN 二 0 
时 , 带 使 能 端的 触发 器 忽略 时 钟 ,保持 原来 的 状态 ; 当 希 望 在 某 些 时 钟 沿 而 不 是 所 有 时 钟 沿 
载 人 一 个 新 值 时 , 带 使 能 端的 触发 器 就 派 上 了 用 场 。 

注意 : 不 要 在 时 钟 上 执行 逻辑 (在 时 钟 上 改动 ), 因 为 这 样 可 能 会 使 时 钟 延 时 并 导致 时 
序 错 误 。 

G) 带 同 步 复 位 功能 的 触发 器 : 带 同步 复位 功能 的 触发 器 增加 了 一 个 称 为 RESET 的 
输入 。RESET 是 一 个 低 电 平 有 效 的 信号 , 即 当 其 为 0 时 执行 复位 功能 。 当 RESET—0 Bf. 
带 同 步 复 位 功能 的 触发 器 忽略 输入 D 并 在 时 钟 上 升 沿 将 输出 Q 复位 为 0; 当 RESET=1 
时 , 带 同步 复位 功能 的 触发 器 与 普通 D 触发 器 一 样 。 

(4) 带 使 能 端 和 同步 复位 功能 的 触发 器 : 带 使 能 端 和 同步 复位 功能 的 触发 器 增加 了 两 
个 输入 EN 和 RESET. EN 的 优先 级 比 RESET 高 , 即 EN 为 1 时 ,RESET 无 效 。 

2) Python 交互 模板 

CD 加 载 比 特 流 的 代码 : 


from pynq import Overlay FIBAIPython/ 
from pynq.lib import AxiGPIO 

overlay = Overlay("/hone/xilinx/jupyter notebooks/...... bit”) Sbit XfHiís 
overlay? 


(2) GPIO 口 命名 的 代码 : 


gpio_0 = overlay. ip_dict[ axi gpio 0'] 
gpio l = overlay. ip_dict[ axi_gpio 1’] 
gpio 2 = overlay. ip_dict[’ axi gpio 2] 


din = AxiGPIO (gpio 0). channel MATRE 
dout = AxiGPIO(gpio 0).channel2 


(3) GPIO 口 读 写 的 代码 : 


mask = 0xff SGPIOfÉRI 
din. write (0xaa, mask) ESA. 
data = hex (dout. read ()) RRR OIRE 
print (data) HTEHGE 
3) 源 代码 
本 实验 源 代码 中 所 含 文件 介绍 同 8.2.2 节 。 
4. 实验 步骤 


实验 步骤 同 8. 2. 2 节 。 
8.2.5 移 位 寄存 器 


1. 实验 目的 
掌握 基于 PYNQ 平台 及 Vivado 工具 的 时 序 逻 辑 电 路 的 开发 流程 及 调试 方式 ,了 解 移 
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位 寄存 器 的 Verilog 行为 描述 ,能 够 在 此 基础 上 使 用 Verilog 描述 8 位 的 带 并 行 加 载 的 移 位 
寄存 器 。 

2. 实验 要 求 

要 求 使 用 Verilog 行为 描述 完成 目标 系统 的 设计 ,采用 Vivado 进行 仿真 ,并 进行 IO 
的 连接 ,最 后 生成 比特 流 文件 ,并 下 板 完 成 验证 。 

3. 实验 要 求 

1) 实验 原理 

CD 移 位 寄存 器 : 移 位 寄存 器 的 原理 图 如 图 8-24 所 示 , 它 由 N 个 触发 器 串联 而 成 。 移 
位 寄存 器 包括 时 钟 . 串 行 输入 Si。 串 行 输出 S 和 N 位 并 行 输出 Qs、_1,。。 在 时 钟 的 每 一 个 
上 升 沿 ,从 S, 移 人 一 个 个 新 的 位 ,所 有 后 续 内 容 都 向 前 移动 。 移 位 寄存 器 可 以 完成 串 行 到 
并 行 的 转换 。 输 入 由 S. 以 串 行 方式 提供 ,在 N 个 周期 后 ,前 面 的 N 位 输入 可 以 在 Q 中 并 
行 访问 。 在 此 基础 上 增加 一 个 低 电 平 异 步 复 位 信号 reset. Verilog 的 行为 描述 请 参考 “基础 
模块 ”的 shift reg. v 文件 。 


THES 


Sout 


Qo Qi 
图 8-24 移 位 寄存 器 


(2) 带 并 行 加 载 的 移 位 寄存 器 : 带 并 行 加 载 的 移 位 寄存 器 增加 了 并 行 输入 Duos 和 控 
制 信号 Load , 它 既 可 以 完成 串 行 到 并 行 的 转换 ,也 可 以 完成 并 行 到 串 行 的 转换 。 当 Load 有 
效 时 ,触发 器 从 输入 D 中 并 行 加 载 数据 ,否则 移 位 寄存 器 正常 移 位 ,在 N 个 周期 后 就 将 
Dy, 以 串 行 的 方式 输出 。 在 此 基础 上 增加 一 个 低 电 平 异步 复位 信号 reset。 

2) Python 交互 模板 

CD 加 载 比 特 流 ( 带 并 行 加 载 移 位 寄存 器 的 python 交互 模板 ) 。 其 代码 如 下 : 

from pynq import Overlay 


from pynq. lib import AxiGPIO 
overlay = Overlay(" /home/xilinx/jupyter notebooks/. bit”) 


Qx.i 


(2) GPIO 口 命名 的 代码 : 


gpio_0 = overlay. ip_dict[ axi_gpio_0 ] 
gpio_CLK = AxiGPIO(gpio_0). channell 
gpio_reset = AxiGPIO(gpio 0).channel2 
gpio_l = overlay. ip_dict[ axi gpio 1'] 
gpio_load = AxiGPIO(gpio 1).channell 
gpio_Sin = AxiGPIO(gpio_1). channel2 
gpio_2 = overlay.ip dict[ axi gpio 2'] 
gpio D = AxiGPIO(gpio 2).channell 
gnio 5 = overlay.ip dict[' axi gpio 5'] 
gpio.Q = AxiGPIO(gpio 5).chamnell 
gnio Sout = AxiGPIO(gpio 5). channel2 


(3) 验证 移 位 寄存 器 串 行 到 并 行 的 功能 ,代码 如 下 : 


# SGPIOR E BUR IHRCIBUUBERUTESS, Mpio Sin ÉlfZ8). SUA E ÅIEEJ2 BR Ob1 
mask = Obl 
* BERTAT 


rr 

gpio CLK. write (0b0, mask) 
gnio reset. write (0b0, mask) 
gpio load write (0b0, mask) 
gpio CLK. write (0bl, mask) 

# Ef SIn-I 

gpio CLK. write (0b0, mask) 
gpio reset. write (0b1, mask) 
gpio Sin. write (Obl, mask) 
goio CLK. write (0bl, mask) 


3 8/UINRISin-I 

gpio CLK. vrite (0b0, mask) 
pio Sin. vrite (Ob1, mask) 
pio. CLK. write (0b1, mask) 


2 BQESUS0b110 
Q-gpio Q. read) 
print(bin(Q)) 


(4) 验证 移 位 寄存 器 并 行 转 串 行 的 功能 ,代码 如 下 : 


# SGPIORERUR FRCIBIUBERUTERI, fuspio SinfE10289, 304 EREE BIBODI 
mask = Obl 

maskl = Oxff 

8 RITERITE 

Sout=[] 


ur 

gpio CLK. write (0b0, mask) 
gpio reset. write (0b0, mask) 
gpio load. write (050, mask) 
gpio CLK. write (Obl, mask) 

# 1T 

gpio_CLK. write (0b0, mask) 
gpio reset. write (0bl, mask) 
gpio load write (0b1, mask) 
gpio D. write (0510100111, mask1) 
gpio CLK. write (0bl, mask) 
tmp-gpio Sout. read () 

Sout. append (tmp) 


& B1 

gpio CLK. write (0b0, mask) 
gpio load write (0b0, mask) 
gpio CLK. write (bl, mask) 
tmp-gpio Sout. read () 
Sout. append (tmp) 

$ RATAR 

gpio_CLE. write (0b0, nask) 

zpio CLK. write (Obl, nask) 

tmp-gpio Sout.read() 

Sout. append (tap) 

print(Sout) 


3) 源 代码 
本 实验 源 代码 中 所 含 文 件 介 绍 同 8. 2. 2 节 。 


验 内 容 设计 |P 145 


ue «| 计算 机 组 成 原理 在 线 实验 教程 一 FPGA 远 程 实验 平台 教学 与 实践 


4. 实验 步骤 
实验 步骤 同 8. 2.2 节 。 


8.2.6 计数 器 


1. 实验 目的 

掌握 基于 Verilog HDL 方式 的 计数 器 程序 设计 方法 ,通过 Vivado 软件 和 PYNQ 平台 ii 
行 开发 调试 ,完成 给 出 的 四 位 计数 器 实验 ,并 进一步 设计 8 位 计数 器 ,并 包含 异步 复位 功能 。 

2. 实验 要 求 

要 求 采 用 源 代 码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 “. v” 源 文件 建立 完整 的 工程 ,使 
用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 I/O 的 连 
接 , 构 成 完整 的 系统 。 最 后 生成 流 文件 ,并 下 板 完成 验证 。 


3. 实验 说 明 

1) 实验 原理 

计数 器 主要 是 对 脉冲 的 个 数 进行 计数 ,N 位 二 进 制 计 数 器 包含 带 有 时 钟 和 复位 输入 ,N 
位 输出 的 时 序 算数 电路 。 复 位 将 输出 初始 化 为 0, 然后 ,计数 器 在 每 CLK 


个 时 钟 的 上 升 沿 递增 1 ,以 二 进 制 顺序 输出 所 有 2* 种 可 能 值 。 可 以 
参考 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 “. v” 源 文件 ,通过 
理解 代码 并 完成 8 位 包含 异步 复位 功能 计数 器 的 设计 。 计 数 器 电 
路 符号 如 图 8-25 所 示 。 

异步 复位 与 同步 复位 的 不 同 在 于 异步 复位 可 以 在 复位 输入 为 0 图 8-25 计数 器 电路 
时 立刻 进行 复位 而 不 用 等 到 下 一 个 时 钟 上 升 沿 时 才 进 行 复位 。 符号 

2) Python 交互 模板 

CD 加 载 比 特 流 的 代码 : 


N 
QH 


Reset 


from pynq import Overlay RUUPy thon 
from pynq.lib import AxiGPIO 

overlay = Overlay("/home/xilinx/jupyter notebooks/...... bit^) #bit MRTE 
overlay? 


(2) GPIO 口 命名 的 代码 : 


| gio 0 = overlay. ip_dictľ axi gnio 0'] 
gpio l = overlay.ip dict['axi gpio 1'] 
gpio 2 = overlay.ip dict[' axi gpio 2'] 


clk = AxiGPIO(gpio 0). channell HAERES 
| rst n = AxiGPIO(gpio 0). channe12 
out0 = AxiGPIO(gpio 1). channell 


G) 复位 设置 的 代码 : 


import time AAA [EJ € 
mask=0b1 APTO 荡 三 
timedelay = 0.1 SIE /IER 
rst n write (0b0, mask) RERI 


rst n write (0b1, mask) 
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(4) 通过 循环 显示 结果 的 代码 : 


import time 
N = 30 
timedelay = 0.1 
sizes = range(0, N, 1) SE EBORE 
mask=0b1 
for size in sizes: 
clk. write(0b0, mask) AENEIS 
clk. write(0b1, mask) 


tmp=0 HRR ARFER 


al = out0. read () 
tmp. append (a1) 


print (tmp) EFT DRE 


3 源 代 码 

本 实验 源 代 码 中 所 含 文件 介绍 同 8. 2. 2 节 。 
4. 实验 步骤 

实验 步骤 同 8. 2. 2 节 。 


8.2.7 ”有限 状态 机 


1. 实验 目的 

学 习 三 段 式 状态 机 的 基本 构成 和 工作 原理 ,实现 三 段 式 状态 机 并 对 其 加 以 改进 和 优化 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 “. v” 源 文件 建立 完整 的 工程 ,使 
用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 W/O 的 连 
接 , 构 成 完整 的 系统 。 最 后 生成 比特 流 文件 ,并 下 板 完 成 验证 。 

3. 实验 说 明 

1) 实验 原理 

图 8-26(a) 所 示 状 态 机 含有 三 个 状态 分 别 是 SO.SI 和 S2。 状 态 机 默认 处 在 SO 状态 , 输 
出 结果 0, 如 果 en=1 时 ,状态 机 进入 状态 1, 输 出 结果 1, 和 否则 状态 不 变 ; 在 状态 1 时 ,如 果 
en 一 1, 状 态 机 进入 状态 2, 输 出 结果 2, 并 且 返 回 到 SO 状态 。 可 以 在 完成 上 述 实验 后 ,再 视 
情况 完成 图 8-26(b) 的 设计 实验 。 


图 8-26 ”状态 切换 
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2) Python 交互 模板 
CD 加 载 比特 流 的 代码 : 


(2) GPIO 口 命名 的 代码 : 


(3) 复位 设置 的 代码 : 


(4) 通过 循环 显示 结果 的 代码 : 


3) 源 代码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 2. 2 节 。 
4. 实验 步骤 

实验 步骤 同 8. 2.2 节 。 
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8.2.8 运算 器 /ALU 


1. 实验 目的 

通过 Verilog HDL 方式 实现 ALU 程序 设计 ,通过 Vivado 软件 和 PYNQ 平台 进行 开 
发 调试 ,实现 ALU 的 功能 ,通过 更 改 调试 文件 来 实现 不 同 的 运算 功能 ,实验 中 所 使 用 的 
ALU 部 分 代码 来 自 开源 RISC-V 处 理 器 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 ”所 提供 的 “. v” 源 文件 建立 完整 的 工程 ,使 
用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 L/O 的 连 
接 , 构 成 完整 的 系统 。 最 后 生成 比特 流 文件 ,并 下 板 完成 验证 。 

3. 实验 说 明 

1) 实验 原理 

ALU 的 真 值 表 如 表 8-3 Bros ,普通 ALU 中 包括 表 8-3 给 出 的 12 种 操作 指令 ,每 个 info 
对 应 不 同 的 指令 类 型 ,输入 特定 的 info 可 以 实现 特定 的 指令 操作 ,通过 修改 调试 程序 可 以 
实现 不 同 的 计算 功能 。 


表 8-3 ALU 真 值 表 
指令 类 型 Info[ 31:0] 说 明 
LUI Oxc008 Imm — 12CZE f£ 12 位 ) 
SUB 0x28 rsl— rs2 
ADD 0x18 rs1 十 rs2 
ADDI 0x8018 rs] -imm 
SLT 0x1008 if(rsl <rs2) return 1;else return 0 
SLTI 0x9008 if(rsl imm) return 1;else return 0 
XOR 0x48 rsl^rs2( 异 或 ) 
OR 0x408 rsl|rs2( 或 ) 
AND 0x808 rsl&rs2( 与 ) 
SUL. 0x88 rsl 逻辑 左 移 rs2 位 
SRL 0x108 rsl EHAE rs2 位 
SRA 0x208 rsl 算术 右 移 rs2 位 


本 实验 与 上 节 运 算 器 实验 不 同 之 处 为 本 实验 通过 Verilog HDL 代码 的 方式 将 运算 通 
路 模块 与 普通 ALU 模块 进行 了 连接 ,连接 两 个 模块 的 文件 称 之 为 ALU 顶层 模块 ,通过 项 
层 文件 可 以 直接 生成 完整 的 ALU 模块 。 

2) Python 交互 模板 

CD 加 载 比 特 流 的 代码 : 

from pynq import Overlay EIB/HPythounfF 

from pynq.lib import AxiGPIO 


overlay = Overlay (" /hone/xilinx/jupyter notebooks/...... bit") — sbitX PER fE 
overlay? 
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(2) GPIO 口 命名 的 代码 : 


gpio_0 = overlay. ip dict[’ axi_gpio 0'] 

gpio rsl = AxiGPIO(gpio 0).channell HEDABEIIEEE 
gpio rs2 = AxiGPIO(gnio 0).chamnel2 

gpio 1 = overlay.ip dict['axi gpio 1°] 

gpio imm = AxiGPIO(gpio 1).channell 

gpio info = AxiGPIO(gpio 1).channel2 

gpio 2 = overlay. ip dict[' axi gpio 2'] 

pio wdat = AxiGPIO(gpio 2). channell 


(3) GPIO 口 读 写 的 代码 : 


mask = Oxffffffff sGPIOfÉSS 
gpio rsl. write(8, mask) JARE 
gpio rs2. write (3, mask) 

gpio_imm. write (0, mask) 

gpio info. write (0x18, mask) 

wdat = gpio wdat. read () 

print (wdat) UTE 


3) 源 代码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 2. 2 节 。 
4. 实验 步骤 

实验 步骤 同 8. 2.2 节 。 


8.2.9 存储 器 


1. 实验 目的 

通过 Verilog HDL 方式 实现 存储 器 程序 设计 ,使 用 Vivado 软件 和 PYNQ 平台 进行 开 
发 调试 ,实现 对 基本 存储 器 模块 的 使 用 ,利用 多 个 存储 器 模块 搭建 更 大 的 存储 器 系统 。 

2. 实验 要 求 

要 求 采 用 源 代 码 中 对 应 目录 下 的 “基础 模块 ”所 提供 的 “. v” 源 文件 建立 完整 的 工程 ,使 
用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 1/0 的 连 
接 , 构 成 完整 的 系统 。 最 后 生成 流 文件 ,并 下 板 完成 验证 。 

3. 实验 说 明 

1) 实验 原理 

基础 模块 中 包含 两 个 独立 的 存储 器 单元 .分别 为 mem2 和 mem2_1, 写 入 和 读 出 数据 时 
都 需要 选择 针对 哪个 存储 器 进行 操作 ,通过 片 选 信号 可 以 控制 要 写 人 和 读 出 的 为 哪 一 个 存 
储 器 , 片 选 信号 为 info 的 第 0 和 1 位 , 当 使 用 mem2 时 ,info 最 低 的 两 位 要 使 用 数值 01 才 可 
以 正常 地 写 和 信和 读 出 ; 当 使 用 mem2_1 时 ,info 最 低 的 两 位 为 10, 如 果 片 选 信号 错误 存储 器 
将 不 能 正常 地 写 和 信和 读 出 数据 。 

本 实验 与 上 节 存 储 器 实验 不 同 之 处 为 本 实验 通过 Verilog HDL 代码 的 方式 将 两 个 存 
储 器 进行 连接 ,将 两 个 存储 器 模块 组 合成 一 个 更 大 的 存储 器 模块 ,连接 两 个 模块 的 文件 称 为 
顶层 模块 。 

完成 上 述 实验 后 可 以 结合 所 学 情况 练习 增加 一 个 片 选 信号 为 11 的 存储 器 到 整体 的 存 
储 器 模块 中 ,并 能 执行 正确 的 数据 写 人 写 出 。 
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2) Python 交互 模板 
CD 加 载 比 特 流 的 代码 : 


from pynq import Overlay #798Python 座 
from pynq. lib import AxiGPIO 

overlay = Overlay(”/home/xilinx/jupyter_notebooks/...... bit") — ebitxf Ab fe 
overlay? 


(2) GPIO 口 命名 的 代码 : 


gpio 0 = overlay.ip dict[ axi gpio 0'] 
gpio_l = overlay.ip dicti axi gpio 1'] 
gpio.2 = overlay. ip dicti axi, gpio 2'] 


info = AxiGPIO(gpio 0).channell GASES 
wdata = AxiGPIO (gio 0). channel2 
rdatal = AxiGPIO(gpio 1).chamnell 
rdata = AxiGPIO(gpio 1). channel2 


G) GPIO H i5 f f. 


mask = Oxffffffff AGPIOfEGS 


info.write(0x15, mask) HABE 
wdata.write(0x99999999, mask) HA ER 


info.write(0xll, mask) 
outl = hex(rdatal. read )) 
print( outl = , out1) BITES. 


info.write(0x26, mask) 

wdata write(0x88880000, mask) 
info.write(0x22, mask) 

out2 = hex (rdata. read()) 
print(' out2 = , out2) 


3) 源 代 码 

本 实验 源 代 码 中 所 含 文件 介绍 同 8. 2.2 节 。 
4. 实验 步骤 

实验 步骤 同 8. 2. 2 节 。 


8.2.10 寄存 器 堆 
1. 实验 目的 
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通过 Verilog HDL 方式 实现 寄存 器 程序 设计 ,使 用 Vivado 软件 和 PYNQ 平台 进行 开 


2. 实验 要 求 


发 调试 ,通过 对 基本 寄存 器 模块 的 使 用 ,能 够 在 单个 寄存 器 基础 上 搭建 寄存 器 组 ,实现 具有 
5 个 寄存 器 的 数据 通路 。 


要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 “. v” 源 文件 建立 完整 的 工程 ,使 


3. 实验 说 明 
1) 实验 原理 


用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 IO 的 连 
接 ,构成 完整 的 系统 。 最 后 生成 流 文件 ,并 下 板 完成 验证 。 


如 图 8-27 所 示 ,数据 写 人 时 默认 暂 存 到 寄存 器 DR 中 ,DR 的 输出 可 以 更 新 Ro 一 R4 中 
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的 任意 一 个 寄存 器 ,具体 更 新 到 哪 一 个 寄存 器 需要 由 各 个 寄存 器 的 使 能 信号 决定 , 当 某 个 寄 
存 器 使 能 为 1 时 ,寄存 器 DR 中 的 数据 进入 相应 的 寄存 器 中 ,端口 A 和 B 都 具有 选择 功能 ， 


通过 输入 的 选择 信号 ,它们 可 以 选择 任 一 个 寄存 器 的 数据 进行 输出 。 


寄存 器 1 数据 
A-port 
ATEA 
Besse 
器 DR 
寄存 器 3 数据 
I B-port 
寄存 器 4 


图 8-27 寄存 器 组 示意 图 


基础 模块 中 给 出 了 DR、R0、R1 三 个 寄存 器 模块 组 合 的 代码 ,实验 时 可 以 先行 验证 这 三 


个 模块 的 运行 结果 ,再 结合 学 习 情 况 扩 充 成 5 个 寄存 器 的 数据 通路 。 
2) Python 交互 模板 
CD 加 载 比 特 流 的 代码 : 


from pynq import Overlay RU/HPython/ 
from pynq. lib import AxiGPIO 
overlay = Overlay (”/home/xilinx/ jupyter notebooks/. 


overlay? 


bit") — sbitYfisie 


(2) GPIO 口 命名 的 代码 : 


gpio_0 = overlay.ip dict['axi gpio 0] 
tpio.l = overlay.ip dict['axi gpio 1'] 
gpio_2 = overlay.ip dict['axi gpio 2'] 
gpio_3 = overlay.ip dict['axi gpio 5'] 
a sel = AxiGPIO (gpio 0). channel INDIES E 
b sel = AxiGPIO (gpio 0). channe12 

DR en = AxiGPIO(gpio 1).channell 

iGPIO (gpio 1).channel2 

iGPIO (gpio 2). channel 

iGPIO (gpio 2).channel2 

a port = AxiGPIO(gpio 3).channell 

b port = AxiGPIO(gpio 3).channel2 


(3) GPIO 口 读 写 的 代码 : 


mask = Oxffff 
DR en. write (1, nask) 


EPIO 
RARE 
DR in. write (Oxffff, mask) 
RO en. write (1, nask) 

a port. write (0b000, mask) 
data = hex(a port.read()) 
print(data) 


RPREUQISUSEE 
ETHER 


30 源 代 码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 2. 2 节 。 
4. 实验 步骤 

实验 步骤 同 8. 2. 2 节 。 


8.2.11 
1. 实验 目的 


总 线 
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第 8 章 


了 解 总 线 的 基本 构成 和 工作 原理 ,通过 Verilog HDL 方式 实现 总 线程 序 设计 ,使 用 
Vivado 软件 和 PYNQ 平台 进行 开发 调试 ,实现 通过 总 线 模块 进行 的 数据 传输 。 


2. 实验 要 求 


要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 “. v” 源 文件 建立 完整 的 工程 ,使 
用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 I/O 的 连 
接 , 构 成 完整 的 系统 。 最 后 生成 比特 流 文件 ,并 下 板 完 成 验证 。 


3. 实验 说 明 
1) 实验 原理 


实现 基于 总 线 进行 数据 传输 的 寄存 器 数据 写 人 与 读 取 。 本 实验 采用 蜂鸟 E203 处 理 器 
中 自 定义 总 线 协议 ICB(Internal Chip Bus) ,该 总 线 应 用 于 蜂鸟 E203 处理 器 中 ,其 结合 AXI 
总 线 和 AHB 总 线 的 优点 , 兼 具 高 速 性 和 易 用 性 。 其 总 线 通道 结构 如 图 8-28 所 示 。 


命令 通道 
地 址 和 | 地 址 和 | 地 址 和 | 地 址 和 
控制 信息 | 控制 信息 | 控制 信息 | 控制 信息 
一 一 - x 
接 接 
口 返回 通道 口 
返回 返回 返回 返回 
结果 结果 结果 结果 
图 8-28 ”总 线 通 道 结构 


ICB 总 线 信号 列表 如 表 8-4 所 示 : 命令 通道 (Command Channel) 主要 用 于 主 设备 向 从 
设备 发 起 读 写 请 求 。 返 回 通 道 (Response Channel) 主 要 用 于 从 设备 向 主 设备 返回 读 写 


结果 。 
表 8-4 ICB 总 线 信号 
通道 方向 宽度 信号 名 介 f 
Output 1 Icb_cmd_valid 主 设备 向 从 设备 发 送 读 写 请 求 信号 
Input 1 Icb cmd ready 从 设备 向 主 设备 返回 读 写 接收 信号 
Output 8 Icb cmd addr 读 写 地 址 
Ay 
命令 通道 Output 1 Icb_cmd_read 读 写 指示 
Output 16 Icb cmd. wdata 写 操作 的 数据 
Output 16 Icb cmd wmask 写 操作 时 的 字 节 掩 码 
Input 1 Icb_rsp_valid 从 设备 向 主 设备 发 送 读 写 反 馈 请 求 信号 
返回 通道 Output 1 Icb_rsp_ready 主 设备 向 从 设备 返回 读 写 反 馈 接收 信号 
Input 16 Icb_rsp_rdata 读 反 馈 的 数据 
Input 1 Icb_rsp_err 读 或 写 反 馈 的 错误 标志 
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ICB 总 线 时 序 有 若干 种 ,图 8-29 为 典型 时 序 中 的 其 中 一 种 : 主 设备 向 从 设备 通过 ICB 
的 Command Channel 发 送 写 操作 请 求 (icb_cmd_read 为 低 ), 从 设备 立即 接收 该 请 求 (icb_ 
cmd ready 为 高 )。 从 设备 在 同一 个 周期 返回 读 结 果 且 结果 正确 (icb_rsp_err 为 低 ) , 主 设备 
立即 接收 该 结果 (icb_rsp_ready 为 高 ) 。 


clk Í | 
icb cmd valid | / A i 1 i i 1 i i f 
icb cmd ready '/ \ i i 1 i 1 i 1 全 
jb end addr Z 5I — — 
icb cmd read ! | | | NS 
icb cmd wdata | 27797777727 e OUUU ZZ 
icb cmd wmask ZZ -Er 一 一 一 2L 
icb rsp valid i / 作 i i ] ' | 
icb_rsp_ready i / N i ] | ] i ] 
icb rsp rdata LLL LL 
icb rsp err | i 1 i i i i | 


图 8-29 典型 时 序 


源 代码 中 包含 总 线 模块 和 ram 模块 两 个 部 分 ,其 中 PYNQ 的 PS 端 为 主 模块 ,ram 模 
块 为 从 模块 ,用 户 通过 PS 端 发 送 数据 ,总 线 模块 接收 数据 并 将 数据 传人 ram 模块 中 , 完 
本 实验 后 可 以 根据 学 习 情 况 和 ICB 总 线 协 议 自行 设计 一 个 从 模块 并 进行 验证 。 

2) Python 交互 模板 

CD 加 载 比 特 流 的 代码 : 


from pynq import Overlay IBAIPython/f- 
from pynq.lib import AxiGPIO 

overlay = Overlay("/home/xilinx/jupyter notebooks/...... bit^) #bit k tHE 
overlay? 


(2) GPIO 口 命名 的 代码 : 


gpio_0 = overlay. ip dict['axi gpio 0 ] 
gpio_1 = overlay. ip « dietl axi gpio 1'] 


gpio 4 7 overlay. ip dict[' axi _gpio 4 ] 
gpio 5 = overlay. ip dict['axi gpio 5'] 


ifu2biu cmd valid = AxiGPIO(gpio 0).channell PIRO T E 
ifu2biu_cmd_addr = AxiGPIO(gpio 0). channel2 
ifu2biu cmd read = AxiGPIO(gpio 1). channell 
ifu2biu cmd wdata = AxiGPIO(gpio 1).channel2 
ifu2biu cmd wmask = AxiGPlO(gpio 2).channell 
ifu2biu rsp ready = AxiGPIO(gpio 2).channel2 
mem icb enable = AxiGPIO(gpio 3). channell 
icb2biu cmd ready = AxiGPIO(gpio 3).channel2 
ifu2biu rsp valid = AxiGPIO(gpio 4).channell 
ifu2biu rsp err = AxiGPIO(gpio 4).channel2 
ifu2biu rsp rdata = AxiGPIO(gpio 5).channell 
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(3) GPIO 口 读 写 的 代码 : 


mask = Oxffff "GPIOR A EIG 
ifu2biu cmd valid.write (0b1, mask) EU dm EET 
ifu?biu cmd addr. write(0x01, mask) 

ifu2biu cmd read. write (0b0, mask) 

ifu?biu rsp ready.write (0bl, mask) 

ifu9biu cmd wdata. write (Üxeeee, mask) 

ifu2biu cmd wmask. write (Oxffff, mask) 

mem icb enable. write(0bl, mask) 


mask = Oxffff 
ifu2biu cmd read. write (0b1, mask) # 谈 出 输出 数据 
ifu2biu cmd addr. write (0x01, mask) 


print (ifu2biu rsp err. read 0) SITEIE 
rdata = hex(ifu2biu rsp rdata. read )) 
print (rdata) 


3) 源 代码 

本 实验 源 代码 中 所 含 文件 介绍 同 8. 2. 2 节 。 
4. 实验 步骤 

实验 步骤 同 8. 2.2 节 。 


8.2.12 微 程 序 控制 器 


1. 实验 目的 

掌握 基于 PYNQ 平台 及 Vivado 工具 的 时 序 逻 辑 电路 的 开发 流程 及 调试 方式 。 本 实验 
提供 了 一 个 简单 的 CPU 模型 机 ,要 求学 生 阅 读 其 Verilog HDL ,理解 其 工作 原理 ,并 补充 完 
善 微 程序 控制 器 中 微 程序 的 设计 ,使 其 可 以 仿真 并 下 板 运 行 。 

2. 实验 要 求 

要 求 采用 源 代码 中 对 应 目录 下 的 “基础 模块 "所 提供 的 “. v” 源 文件 建立 完整 的 工程 ,使 
用 其 中 的 测试 文件 进行 整体 仿真 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 1/O 的 连 
接 , 构 成 完整 的 系统 。 最 后 生成 比特 流 文件 ,并 下 板 完成 验证 。 

3. 实验 说 明 

1) 实验 原理 

(1) CPU 数据 通路 : 如 图 8-30 所 示 ,每 一 条 机 器 指令 的 执行 过 程 都 可 分 为 两 个 阶段 : 
取 指 阶段 和 执行 阶段 。 

程序 计数 器 (PC) 是 一 条 指令 的 起 点 ,所 以 在 取 指 阶段 ,首先 由 PC 输出 将 要 执行 的 机 器 
指令 的 地 址 ,接着 指令 存储 器 (Imem) 将 与 该 地 址 对 应 的 机 器 指令 输出 到 指令 寄存 器 IR. I] 
时 PC 指向 下 一 条 要 执行 的 指令 ,为 下 次 取 指 做 准备 。 

接着 ,IR 将 指令 的 操作 码 送 入 指令 译 码 器 (Decoder) , 译 码 器 中 存储 有 与 之 对 应 的 微 程 
序 的 入 口 地 址 ,将 其 送 入 到 微 程 序 计数 器 (MPC) ,最终 由 MPC 确定 将 要 执行 的 微 指令 地 
址 ,将 该 条 微 指令 从 微 指令 控制 存储 器 (CUmem) 中 读 出 ,将 这 些 控 制 信和 号 发 送 送 到 CPU 
的 各 个 组 件 , 指 令 便 开始 执行 。 
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总 线 DBUS 
c 
ALU en 数 存 R omen en 指 在 | 
一 (一 一 一 一 /| 返 算 7 1 
: ALU 十 地 址 | ”数据 地 址 | opfid ! 地 址 码 
m=] B_en 5 70 1 
i 6 100 i 
| 7 66 E 1 
-一 AL ——llB | 10 77 ei T 
Ro : : i 
RI 30 40 ! 
R  ] 31 1 
Rs f Pcse! 
fr Ind. used uu |AR en mem I +1 
DR e| AR 地 址 缓存 器 PC| ”程序 计数 器 
z Hd 一 ee 
DR | 数据 缓存 器 
MPC 
微 程序 计数 器 
sivo PS anien 
| IJ 
CUmem 指令 寄存 器 


图 8-30 CPU 数据 通路 图 


(2) 指令 设计 : 该 模型 机 设计 了 3 条 数据 转移 类 指令 (MOV ,LAD,STO),7 条 运算 类 
指令 (ADD, SUB, INC, DEC, AND, OR, NOT),7 条 跳 转 类 指令 (JEQ,JNE,JHI,JHS， 
JLO,JLS,JMP) 以 及 比较 指令 (CMP) 和 停机 指令 (HLT), 共 19 条 指令 。 其 中 , 仅 有 LAD 
5j STO 可 以 访问 存储 器 ,大 多 数 的 指令 采用 寄存 器 寻 址 ,LAD 和 STO 的 寻 址 方式 为 间接 
寻 址 , 跳 转 指令 及 部 分 第 二 操作 数 为 立即 数 的 指令 采用 立即 寻 址 方式 。 

具体 指令 设计 见 源 代码 资料 包 中 本 实验 文件 夹 中 的 “附录 2”。 

G) 取 指 微 指令 的 实现 : 

第 一 条 微 指 令 如 图 8-31 所 示 。 


ZF_en PC_en PC_sel Imem en MPC en MPC sel cs we 
0 0 0 t 1 10 0 0 
ALU_en B en Dmem en | IR data en CF en Rd used | RsA used | RsB used 
0 0 0 0 0 0 0 0 
AR en outenab M SC4 位 ) Next_addr(16 位 ) 
0 0 0 0000 0000 0000 0000 0001 


图 8-31 第 一 条 微 指令 


O 第 一 个 周期 : PC 中 的 地 址 送 入 指令 寄存 器 Imem ,通过 发 送 控制 信号 Imem_en, 使 
该 地 址 对 应 的 指令 操作 码 (Opcode) 从 Imem 经 过 总 线 DBUS 进入 指令 译 码 器 ,经 过 翻译 ， 
从 指令 译 码 器 流出 的 数据 变 成 了 这 条 指令 在 CUmem 中 的 入 口 地 址 ,入 口 地 址 被 输入 到 微 
程序 计数 器 MPC 的 MPC_in 中 。 同 时 发 送 了 控制 信号 MPC_sel 一 “10”, 代 表 着 下 一 条 微 
指令 地 址 将 从 CU_mem 传 回 的 next_addr 中 获取 (此 处 next_addr 即 为 取 指 程序 的 第 二 条 
微 指令 地 址 ) 。 
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第 二 条 微 指令 如 图 8-32 所 示 。 


ZF_en PC en PC sel Imem en MPC en MPC sel cs we 
0 1 0 0 1 1 0 0 
ALU en B en Dmem en | IR data en CF en Rd used | RsA used | RsB used 
0 0 0 0 0 0 0 0 
AR en outenab M S(4 位) Next_addr(16 位 ) 
0 0 0 0000 01 0000 0000 0000 


图 8-32 第 二 条 微 指令 


@ 第 二 个 周期 : 由 于 控制 单元 发 送 的 微 程序 计数 器 MPC 的 选择 信号 MPC sel— "11" 
( 意 为 将 MPC in 输出 ) ,指令 的 入 口 地 址 便 被 送 入 CUmem,CUmem 便 从 该 指令 入 口 地 址 
开始 ,逐条 发 送 该 指令 对 应 的 控制 信号 。 同 时 ,可 以 注意 到 表 中 的 第 二 行 ,PC_en 被 置 为 
“1”, 且 PC. sel — "00" (3g PC 二 PC 十 1), 从 而 使 PC 指向 下 一 条 指令 ,为 下 一 次 取 指 做 好 
准备 。 

OD 代码 层次 结构 : 


| -- tinycpu. v 

—— ALU. v 

—-— DBUS. v 

-- Regsfile.v 

-—- Dmem. v 

-—- Imem.v 

—- Program Counter. v 
—- Decoder. v 

=- Wy 

—- CUmem. v 


=- psw.v 


具体 代码 请 阅读 基础 模块 文件 夹 。 
2) Python 交互 模板 
CD 加 载 比 特 流 的 代码 : 


re 
Load overlay 

qe =: = 一 -一 = = = = 
from pynq import Overlay 

from pynq. lib import AxiGPIO 

overlay = Overlay(' /hone/xilinx/jupyter. notebooks /wzg/cpu/desi gn 3. bi t") 


(2) GPIO 口 的 命名 代码 : 


t GPIOETÉS |] 

= 一 = = 

gpio_5 = overlay.ip dict[' axi gpio 5'] 
gpio n0 = AxiGPIO (gpio 5). channell 
gpio nl = AxiGPIO (gpio 5). channel2 
spio 6 = overlay.ip dict[ axi gpio 6’ ] 
gpio a2 = AxiGPIO (gpio 6). channell 
gpio n3 = AxiGPIO (gpio 6). channel2 
gpio 7 = overlay.ip dict['axi gnio 7'] 
gpio m4 = AxiGPIO (gpio, 7). channell 
gpio n5 = AxiGPIO(gpio 7). channel2 
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(3) 验证 CPU 是 否 成 功 排序 ,其 代码 如 下 : 


E cerron 
一 一 一 一 一 
import tine 

timedelay = 0.0001 
tine. sleep (tinedelay ) 
tnp=[] 

m0 = gpio_n0.readO 
tnp. append (n0) 

al = gpio mi.readO 
tnp. append (n1) 

n2 = gpio_n2. read() 
tap. append (n2) 

a3 = gpio_n3. read() 
tnp. append n3) 

n4 = gpio m4. read. 
tnp. append (n4) 

n5 = gpio m5.readO 


tnp. append (n5) 
print (tap) 


[lo, 1, 4 5 6 10] 
3) 源 代码 


本 实验 源 代码 中 所 含 文件 介绍 同 8. 2. 1 节 。 
4. 实验 步骤 


(1) 将 CUmem 中 的 微 指令 设计 完整 ,将 “基础 模块 "中 的 所 有 .v 源 文件 添加 到 工程 中 。 
(2) 使 用 本 实验 对 应 源 代码 中 的 simu_cpu 仿真 文件 进行 仿真 ,观察 m0 — m5 的 值 是 否 
为 排序 后 的 值 (0,1,4,5,6,10)。 因 为 仿真 时 间 超 过 默认 时 间 , 所 以 需要 在 simulation 


setting 中 将 simulation runtime 设置 为 40ps。 
(3) 将 仿真 后 的 设计 生成 原理 图 添加 到 IPrepository。 
(4) 按照 图 8-33 所 示 和 接口 模块 相连 接 。 


pie io inls:d4 E. 
erm | 
pio? io i[15:0]« 


图 8-33 ”模型 机 与 接口 模块 连接 方式 
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(5) 重新 综合 、 实 现 及 生成 比特 流 文件 ,并 将 比特 流 文件 及 对 应 的 tel 文件 上 传 到 所 用 
的 PYNQ 节点 。 

(6) 下 板 实验 ,使 用 本 实验 对 应 材料 中 的 Python 调试 文件 ,观察 真实 运行 后 的 CPU 模 
型 机 是 否 正常 工作 。 


8.2.13 中 断 


1. 实验 目的 

通过 开源 RISC V 处 理 器 (E203) 这 一 实例 ,掌握 理解 RISC_V 架构 的 中 断 异 常 处 理 
机 制 。 

2. 实验 要 求 

在 著名 开源 网 站 GitHub 上 搜索 e200_opensource, 下 载 该 项 目的 源 代码 (或 查看 源 代 
码 资 料 包 中 8. 2. 15 文件 夹 中 的 相关 资料 ) ,文件 目录 中 的 rtl 文件 夹 包含 了 实验 中 要 使 用 的 
全 部 源 代码 ,应 用 图 8-34 中 的 core 和 general 文件 夹 中 的 “. v” 文 件 建立 工程 ,根据 给 出 的 
仿真 文件 和 自 测试 文件 分 析 仿 真 波形 图 ,理解 中 断 的 处 理 机 制 。 


2018/12/3 21:59 Si 

Ji debug 2018/10/27 16:45 ”文件 交 

fab, 2018/10/27 16:45 Si% 

2018/12/3 21:59 KA 

T mems 2018/10/27 16:45 ”文件 实 

Ji perips 2018/10/27 16:45 ”文件 去 

J soc 2018/10/27 16:45 ”文件 到 

J subsys 2018/10/27 16:45 ”文件 闪 

图 8-34 文件 目录 

3. 实验 说 明 
1) 实验 说 明 


中 断 和 异常 都 可 以 打 断 程序 的 正常 执行 , 且 它 们 之 间 最 大 的 区 别 是 起 因 内 外 有 别 。 因 
此 ,中 断 和 狭义 上 的 异常 可 以 看 作 是 一 种 广义 上 的 异常 。 一 般 异常 可 分 为 同步 异常 .精确 异 
步 异 常 和 非 精确 异步 异常 。 

RISC V 架构 虽然 支持 多 种 工作 模式 ,但 是 要 求 机 器 模式 是 必须 具备 的 模式 。 因 此 ,在 
这 仅 简 单 介绍 基于 机 器 模式 的 异常 处 理 机 制 。 

(D RISC_V 架构 中 与 异常 相关 的 CSR( 控 制 状态 ) 寄 存 器 如 下 : 

(D mtvec: 定义 进入 异常 服务 程序 的 PC 地 址 ; 

© mcause: 反映 进入 异常 的 原因 ; 

@ mtval: 反映 进入 异常 的 信息 ; 

(D mepe: 用 于 保存 异常 的 返回 地 址 ; 

© mstatus: 用 于 反映 中 断 全 局 使 能 ; 

@ mie: 用 于 控制 不 同类 型 的 局 部 使 能 ; 

O mip: 反映 不 同类 型 中 断 的 等 待 状态 。 

(2) 当 处 理 器 进入 异常 时 ,处 理 步骤 如 下 : 

CD 处 理 器 停止 当前 程序 流 , 转 而 从 CSR 寄存 器 mtvec 定义 的 PC 地 址 开始 执行 异常 服 
务 程序 。 
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@ 硬件 同时 更 新 mcause、mepc、mtval 和 mstatus 四 个 寄存 器 。 

在 执行 异常 服务 程序 时 会 通过 mcause 中 异常 的 编号 来 决定 进一步 跳 转 到 更 具体 的 异 
常服 务 程 序 。 

(3) 当 程 序 完成 异常 处 理 后 ,需要 从 异常 服务 程序 中 退出 ,并 返回 主 程序 。RISC_V 架 
构 定 义 了 一 个 专门 的 退出 异常 指令 MRET。 处 理 器 执行 MRET 指令 后 会 停止 执行 当前 程 
序 流 ,同时 更 新 mstatus 寄存 器 。 

有 关 蜂鸟 E203 处 理 器 的 更 详细 的 中 断 机 制 请 参考 (手把手 教 你 设计 CPU 一 一 RISC-V 
处 理 器 ) 进 行 学 习 。 

2) 源 代码 

本 书 配套 源 代码 中 ,为 此 实验 提供 了 如 下 材料 : 

COD "test, v”: 是 对 用 户 整体 工程 进行 仿真 时 所 需 的 Testbench 示例 程序 。 

(2)“rv32ui_p_addi. data"; 是 用 于 初始 化 ITCM 的 addi 指令 测试 程序 文件 。 

(3) “rv32ui_p_addi. dump”: 是 上 述 测试 程序 的 反 汇 编 文 件 。 

4. 实验 步骤 

CD 依据 实验 要 求 下 载 需要 的 源 代 码 并 完成 工程 的 建立 ,再 将 rv32ui_p_addi. data 文件 
添加 到 工程 中 。 

(2) 对 工程 进行 仿真 ,对 照 反 汇编 文件 分 析 波 形 图 ,如 图 8-35 所 示 。 


图 8-35 ”仿真 波形 图 


8.2.14 基于 开源 项 目的 CPU 内 核 的 实现 


1. 实验 目的 

了 解 开源 处 理 器 的 相关 知识 ,阅读 开源 的 蜂鸟 E200 系列 处 理 器 的 相关 资料 和 Verilog 
代码 ,深入 了 解 此 款 处 理 器 内 核 部 分 的 代码 。 

2. 实验 要 求 

在 著名 开源 网 站 GitHub 上 搜索 e200_opensource, 下 载 该 项 目的 源 代码 ,文件 目录 中 
的 rd 文件 夹 包含 了 实验 中 要 使 用 的 全 部 源 代码 ,从 代码 中 抽出 内 核 部 分 代码 ,并 能 保证 其 
能 进行 正确 的 仿真 或 实现 。 

3. 实验 说 明 

蜂鸟 E200 处 理 器 不 仅 完成 了 内 核 的 实现 ,还 搭配 完整 的 SoC 平台 ,其 结构 如 图 8-36 
所 示 ,本 实验 要 求 读 者 从 E200 完整 的 代码 中 抽出 内 核 的 相关 代码 。 
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其 他 系统 
X5 协 处 理 器 广 设备 接口 
i DE | 常 开 域 
外 部 DTCM 接 口 Be EAI 协 处 理 器 接口 PWM0 
一 站 -~|PwMl 
ZNEITCMS E EM E200 系 列 处 理 器 核 上 -Eve 
$h amf PRCI 
MIS 
M M M M id e=] GPIO 
| i i tf I--|UARTO 
快速 [Puc ||cuNr & mlUARTI 
IO 接口 m [=| QSPIT 
系统 存储 总 线 TD 
i m| GPIO 
QSPI- | 其 他 系统 --| OTP 
MROM| | OTP. || Flash | 存储 接 FOsPIO| 
存储 读 || 存 储 读 mR 
= Debug 
JTAG 接 口 一 一 一 一 | 模块 
图 8-36 E200 系列 处 理 器 配套 SoC 
4. 实验 步骤 
CD 查阅 有 关 蜂 鸟 E200 系列 处 理 器 的 相关 资料 ,阅读 其 源 代码 并 找 出 内 核 的 相关 
代码 。 


(2) 对 内 核 相 关 代码 进行 仿真 ,观察 仿真 结果 是 否 满足 设计 要 求 。 

(3) 将 本 实验 对 应 . v 文件 生成 IP 核 。 

(4) 调用 IP 核 ,进行 I/O 处 理 ,将 系统 的 逻辑 I/O 与 PS 相连 接 , 以 便 进行 调试 。 

(5) 重新 综合 、 实 现 及 生成 比特 流 文件 ,并 将 比特 流 文件 及 对 应 的 tel 文件 上 传 到 所 用 
PYNQ 节点 。 

(6) 下 板 实验 ,自行 设计 Python 调试 文件 ,观察 真实 运行 后 的 系统 是 否 正常 工作 。 


8.2.15 为 开源 CPU 增加 指令 


1. 实验 目的 

了 解 开源 处 理 器 的 相关 知识 .阅读 开源 的 蜂鸟 E200 系列 处 理 器 的 相关 资料 和 Verilog 
代码 ,了 解 处 理 器 内 核 部 分 的 完整 工作 机 制 和 流程 。 

2. 实验 要 求 

本 实验 提供 了 一 个 不 完整 的 蜂鸟 E200 系列 处 理 器 项 目 , 通 过 补 全 代码 使 E203 处 理 器 
能 正常 运行 ,通过 仿真 方式 对 处 理 器 进行 功能 验证 。 

3. 实验 说 明 

处 理 器 中 缺少 的 部 分 都 位 于 E200 系列 处 理 器 的 流水 线 第 2 级 一 一 执行 阶段 ,该 阶段 
缺少 部 分 指令 的 译 码 和 执行 代码 ,读者 通过 了 解 内 核 部 分 的 工作 机 制 和 工作 流程 ,将 蜂鸟 
E200 系列 内 核 中 缺少 的 部 分 补充 完整 ,使 其 正常 运行 。 
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4. 实验 步骤 

CD 查阅 有 关 蜂 鸟 E200 系列 处 理 器 的 相关 资料 ,查看 源 代码 ,了 解 处 理 器 内 核 部 分 的 
的 完整 工作 机 制 和 流程 。 

(2) 对 内 核 相关 代码 进行 仿真 ,观察 仿真 结果 是 否 满足 设计 要 求 。 

(3) 将 本 实验 对 应 . v 文件 生成 IP 核 。 

(4) 调用 IP 核 ,进行 I/O 处 理 , 将 系统 的 逻辑 1/O 与 PS 相连 接 , 以 便 进行 调试 。 

(5) 重新 综合 、 实 现 及 生成 比特 流 文件 ,并 将 比特 流 文件 及 对 应 的 tel 文件 上 传 到 所 用 
PYNQ 节点 。 

(6) 下 板 实验 ,自行 设计 Python 调试 文件 ,观察 真实 运行 后 的 系统 是 否 正常 工作 。 


8.2.16 增加 开源 CPU 的 流水 线 级 数 


1. 实验 目的 

了 解 处 理 器 的 流水 线 基本 概念 ,通过 开源 的 蜂鸟 E203 处 理 器 的 Verilog 代码 深入 理解 
此 款 处 理 器 的 流水 线 工作 流程 ,并 对 此 款 处 理 器 进行 改进 ,将 此 款 开源 处 理 器 的 2 级 流水 线 
改 为 3 级 流水 线 。 

2. 实验 要 求 

在 著名 开源 网 站 GitHub 上 搜索 e200_opensource, 并 下 载 该 项 目的 源 代码 ,文件 目录 
中 的 rtl 文件 夹 包 含 了 实验 中 要 使 用 的 全 部 源 代码 ,应 用 图 8-37 中 的 core 和 general 文件 
erp gn. v” 文 件 建立 工程 ,通过 对 工程 文件 的 修改 完成 流水 线 的 增加 ,通过 仿真 观察 流水 线 
改变 后 的 波形 图 结果 ,仿真 完成 后 生成 IP, 并 调用 所 生成 的 IP 进行 1/O 的 连接 ,构成 完整 
的 系统 。 最 后 生成 比特 流 文件 ,并 下 板 完成 验证 。 


2018/12/3 21:59 文件 去 

d debug 2018/10/27 16:45 iE 

fab 2018/10/27 16:45 xét 

munis aha 

a mems 2018/10/27 16:45 xXx 

点 perips 2018/10/27 16:45 Sip 

J soc 2018/10/27 16:45 ”文件 去 

J subsys 2018/10/27 16:45 ”文件 去 

图 8-37 文件 目录 
3. 实验 说 明 

本 实验 中 用 到 的 蜂鸟 E203 处 理 器 具有 两 级 流水 线 , 其 结构 如 图 8-36 所 示 , 其 要 点 


WTF: 

CD 流水 线 的 第 1 级 为 " 取 指 (由 IFU 完成 )”。 

(2) 蜂鸟 E203 的 * 译 码 近 执行 近 写 回 ” 均 处 于 同一 时 钟 周期 ,属于 流水 线 第 2 级 。 

增加 流水 线 的 长 度 可 以 通过 在 蜂鸟 E203 处 理 器 第 2 级 流水 中 增加 流水 线 寄 存 器 来 实 
现 ,关于 流水 线 方面 的 问题 可 以 参考 网 上 资料 或 者 查阅 相关 书籍 进一步 了 解 ,有 关 蜂 鸟 
E203 处 理 器 的 更 多 内 容 也 可 以 参考 4 手把手 教 你 设计 CPU 一 一 RISC-V 处 理 器 》 进 行 学 习 。 

4. 实验 步骤 

CD 查阅 有 关 处 理 器 流水 线 的 相关 资料 ,理解 本 实验 的 相关 代码 ,对 E203 处 理 器 的 源 
代码 进行 修改 实现 3 级 流水 。 
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m 


EXU 


图 8-38 E203 流水 线 结构 


(2) 通过 对 处 理 器 进行 仿真 ,观察 仿真 结果 是 否 实现 3 级 流水 结构 。 

(3) 将 本 实验 对 应 . v 文件 生成 IP 核 。 

(4) 调用 IP 核 ,进行 I/O 处 理 , 将 系统 的 逻辑 I/O 与 PS 相连 接 , 以 便 进行 调试 。 

(5) 重新 综合 、 实 现 及 生成 比特 流 文件 ,并 将 比特 流 文件 及 对 应 的 tel 文件 上 传 到 所 用 
PYNQ 节点 。 

(6) 下 板 实验 ,自行 设计 Python 调试 文件 ,观察 真实 运行 后 的 系统 是 否 正常 工作 。 
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